b, f, p, v = 1
c, g, j, k, q, s, x, z = 2
d, t = 3
l = 4
m, n = 5
r = 6
ll, y, ch = 7
4. Si hay números consecutivos, dejar solamente uno en la
serie.
5. Retornar los cuatro primeros caracteres, si son menos de
cuatro completar con ceros.
SOUNDESP es un proyecto abierto y es bienvenido cualquier
comentario para mejorar su implementación.
Y Rules:
(Keep) : Y -> when alone, or after a vowel, or followed by a
consonant, or at the end of a word, is a vowel, and
sounds as e or ee in English: Hoy y mañana (today and
tomorrow), o’-e ee mah-nyah’-nah
(remove) : Y -> before a vowel in the same syllable, or
between two vowels in the same word, is a consonant,
and sounds like the English y in the words yard, yell,
you
German SoundEx Algorithm
http://www.sound-ex.de/soundex_verfahren.htm
https://de.wikipedia.org/wiki/Soundex
Grundregeln
Jeder Soundex-Code besteht aus einem Buchstaben gefolgt von drei
Ziffern, z.B. W-213 für Wikipedia. Hat das zu codierende Wort
soviele Buchstaben, daß man mehr Ziffern erzeugen könnte, bricht
man nach der dritten Ziffer ab. Hat das Wort zu wenige
Buchstaben, füllt man die letzten Ziffern mit 0-en auf. Der
asiatische Name Lee wird also als L-000 codiert.
Ziffer => Repräsentatierte Buchstaben
1 => B, F, P, V
2 => C, G, J, K, Q, S, X, Z
3 => D, T
4 => L
5 => M, N
6 => R
Die Vokale A, E, I, O und U, als auch die Konsonanten H, W und Y
sind zu ignorieren, allerdings nicht an erster Stelle als
führender Buchstabe. Erweiternd für die deutsche Sprache
174