New York State Identification and Intelligence System
หน้าตา
บทความนี้มีชื่อเป็นภาษาอังกฤษ เนื่องจากยังไม่มีชื่อภาษาไทยที่กระชับ เหมาะสม, ไม่ปรากฏคำอ่านที่แน่ชัด หรือไม่ปรากฏคำแปลที่ใช้ในทางวิชาการ |
รหัสสัทลักษณ์ของ New York State Identification and Intelligence System หรือเรียกย่อว่า NYSIIS เป็นขั้นตอนวิธีเชิงสัทลักษณ์คิดค้นขึ้นในปี ค.ศ. 1970 (ปัจจุบันระบบเป็นส่วนหนึ่งของ New York State Division of Criminal Justice Services) มีความแม่นยำมากกว่าขั้นตอนวิธีซาวเดกซ์แบบดั้งเดิม 2.7% [1] เป็นการจับคู่หน่วยเสียง (phoneme) ที่คล้ายกันให้เข้ากับอักษรตัวเดียวกัน ให้ผลลัพธ์เป็นสายอักขระซึ่งสามารถอ่านได้โดยไม่ต้องถอดรหัส ขั้นตอนวิธีนี้อธิบายเทคนิคการค้นหาชื่อ มีอยู่ด้วยกัน 2 แบบ คือแบบดั้งเดิม และแบบดัดแปลง (แบบดัดแปลงไม่ใช่ของทางการ)
- เปลี่ยนตัวอักษรเริ่มแรกของชื่อโดยที่ MAC → MCC, KN → N, K → C, PH, PF → FF, SCH → SSS
- เปลี่ยนตัวอักษรหลังสุดของชื่อโดยที่ EE → Y, IE → Y, DT, RT, RD, NT, ND → D
- คำสำคัญตัวแรกก็คือตัวอักษรแรกของชื่อ
- เปลี่ยนตัวอักษรที่เหลือโดยทำตามกฎดังนี้ โดยนับตัวอักษรเพิ่มทีละตัว
- EV → AF นอกนั้น A, E, I, O, U → A
- Q → G, Z → S, M → N
- KN → N นอกนั้น K → C
- SCH → SSS, PH → FF
- H → ถ้าตัวก่อนหน้าหรือหลังจากตัวอักษรนี้ไม่ใช่สระ ก็ให้ใช้ตัวก่อนหน้านี้
- W → ถ้าตัวก่อนหน้านี้เป็นสระ ก็ให้ใช้ A
- เติมตัวอักษรปัจจุบันลงในคำสำคัญถ้าตัวอักษรปัจจุบันไม่เท่ากับ ตัวอักษรตัวสุดท้ายของคำสำคัญ
- ถ้าตัวอักษรตัวสุดท้ายเป็น S ให้ตัดทิ้ง
- ถ้าตัวอักษรตัวสุดท้ายเป็น AY ให้เปลี่ยนเป็น Y
- ถ้าตัวอักษรตัวสุดท้ายเป็น A ให้ตัดทิ้ง
- ยุบตัวอักษรทุกตัวของตัวอักษรที่ซ้ำกัน
- เติมตัวอักษรตัวแรกของชื่อ โดยใช้ตัวอักษรตัวแรกของคำสำคัญ
ขั้นตอนวิธีแบบดัดแปลง
[แก้]- ถ้าตัวอักษรตัวแรกของชื่อเป็นสระ จำสระนั้นไว้ก่อน
- เอาตัวอักษร S และ Z จากตัวสุดท้ายของชื่อออก
- เปลี่ยนตัวอักษรตัวแรกของชื่อดังนี้ MAC → MC, PF → F
- เปลี่ยนตัวอักษรที่เหลือในชื่อดังนี้ IX → IC, EX → EC, YE, EE, IE → Y, DT, RT, RD, NT, ND → D
- เปลี่ยน EV → EF ถ้าไม่ได้ขึ้นต้นของชื่อ
- คำสำคัญตัวแรกก็คือตัวอักษรแรกของชื่อ
- ตัด W ออกถ้า W ตามหลังสระ
- แทนสระทุกตัวด้วย A
- เปลี่ยน GHT → GT
- เปลี่ยน DG → G
- เปลี่ยน PH → F
- ถ้า H ไม่ใช่ตัวอักษรตัวแรก ให้ตัดออกหมด
- เปลี่ยน KN → N ถ้าไม่ใช่ก็ K → C
- ถ้า M ไม่ใช่ตัวอักษรตัวแรก ให้เปลี่ยนเป็น N
- ถ้า Q ไม่ใช่ตัวอักษรตัวแรก ให้เปลี่ยนเป็น G
- เปลี่ยน SH → S
- เปลี่ยน SCH → S
- เปลี่ยน YW → Y
- ถ้า Y ไม่ใช่ตัวอักษรตัวแรกหรือตัวสุดท้าย ให้เปลี่ยนเป็น A
- เปลี่ยน WR → R
- ถ้า Z ไม่ใช่ตัวอักษรตัวแรก ให้เปลี่ยนเป็น S
- เปลี่ยน AY → Y
- เอาสระที่ติดกันยาวๆออก
- ยุบตัวอักษรทุกตัวของตัวอักษรที่ซ้ำกัน
- ถ้าตัวอักษรข้างหน้าเป็นสระ นำตัวอักษรที่จำไว้ใส่แทน
อ้างอิง
[แก้]- ↑ Rajkovic, P.; Jankovic, D. (2007), "Adaptation and Application of Daitch-Mokotoff Soundex Algorithm on Serbian Names" (PDF), XVII Conference on Applied Mathematics, Novi Sad, Serbia, คลังข้อมูลเก่าเก็บจากแหล่งเดิม (PDF)เมื่อ 2011-08-27, สืบค้นเมื่อ 2011-09-07
- ↑ Taft, R. L. (1970), "Name Search Techniques", Albany, New York: New York State Identification and Intelligence System
{{citation}}
:|title=
ไม่มีหรือว่างเปล่า (help)
- http://www.dropby.com/indexLF.html?content=/NYSIIS.html
- http://en.literateprograms.org/Special:Downloadcode/New_York_State_Identification_and_Intelligence_System_%28Rexx%29 เก็บถาวร 2015-09-11 ที่ เวย์แบ็กแมชชีน