سلام من دلم میخواست تو حوزه متن کاوی فارسی کار جامعی انجام بدم، کاری که کشورهای دیگه و زبان های دیگه انجام شده، به نظر رسید که ما یه پارسر دقیق توی فارسی نداریم، لازمه پارسر یه لیستی از اسامی بود.یه فراخوان توی توییتر دادم که بچه ها بیان به من کمک کنن و یه لیستی رو از داده هایی که باید میگرفتیم رو اماده کردم، البته هنوز داده هایی کرال نشده دیگه ای هم موجود هست، اما تو نسخه۱ محمود اسکندری و محمدرضا کوشا کمک کردن ، هرچند از رپوهای دیگری مثل اسامی دختر و پسری هم که جادی گذاشته استفاده کردم و البته اینکه ممکن کسی هم باشه که من فراموش کرده باشم اسمش رو بذارم، بهتره که به من پیام بده و یا خودش اسمش رو اضافه کنه! نیلوفر فرج پور هم زحمت مرتب کردن داده ها رو کشیده. ، ادامه این کار به این صورت هست که اگه کسی وقت داشته باشه لیست اسامی و اشخاص رو میتونم براش ایمیل کنم که کرال کنه و به این لیست اضافه کنه و در طول زمان بهتر بشه. توی همین ریپو تلاش میکنم تا نسخه اولیه ای از اینکه چطور در مورد پارس کردن متن فکر میکنم و یا ساختارش چه جوری هست رو بذارم طبعا کانتربیوت شما رو با جان و دل میخرم! البته لیست اصطلاحات، مفاهیم و کلمات رو هم اضافه میکنم که قطعا کار شخص خودم هست و کسی به من کمک نکرده
-
Notifications
You must be signed in to change notification settings - Fork 7
The list of Persian Name
License
OverFlowData/NER-
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
About
The list of Persian Name
Topics
Resources
License
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published