R хэл дээр монгол хэлний үгийн алдаа шалгах боломж
R дээр Mongolian Spell Checking хийх талаар Facebook мсжр-ээр асуужээ. Уг асуулт R хэрэглэгч өргөн олонд хамаатай тул хариултаа блогтоо ийнхүү бичив.
R програм буюу R хэлтэй холбоотой асуулт надад маш их ирдэг бөгөөд тэдгээрээс олон хүнд хамаатай, өргөн хүрээ хамрах буюу товчхондоо ач холбогдолтой асуултуудад хариулж, улмаар хариултаа энэхүү блогтоо бичих, YouTube сувагтаа видео байдлаар оруулах зэргээр нийтэд түгээдэг юм.
R дээр үгийн алдаа шалгахад hunspell
гэсэн багц өргөн ашигладаг. RStudio IDE-ын хувьд тохиргооных нь Spelling хэсэгт үгийн алдаа шалгахад ашиглах боломжтой толь бичгийн жагсаалт сонгох хэсэг бий.
Зураг дээрх сонголтыг ашиглаж өөр хэл суулгасан ч тэр дунд монгол хэл байдаггүй. Гэхдээ монгол хэлний толь бичиг гар аргаар суулгах боломжтой бөгөөд энэ талаар help товчлуурт нь харгалзах веб хуудас дээр тодорхой заавар байгааг үзэж болно. Тэнд бичсэнчлэн RStudio програмын хэрэглэгчийн тохиргооны хавтас дахь dictionaries/languages-user
дэд хавтас дотор OpenOffice/LibreOffice програмын монгол хэлний толь бичгийн .aff
болон .dic
файлуудыг хуулах шаардлагатай. Ийнхүү хуулсаны дараа тохиргооны цонхоо ахин шинээр нээж үзэхэд монгол хэлний толь бичиг сонголт дотор нэмэгдэж орсон байх болно.
Гэвч энд .aff
болон .dic
файлууд компьютерийн мэдлэг, туршлага хомс хүмүүст нэлээд бүрхэг байж магадгүй. Эдгээр нь дээр нэр дурдсан оффисын програмуудын монгол үгийн алдаа шалгах толь бичиг болох өргөтгөл (.oxt
гэсэн файлын нэрний өргөтгөлтэй файл) дотор агуулагдана. Уг файлыг архивын файлтай ажилладаг програмаар задалж өнөөх .aff
болон .dic
файлуудаа гаргаж авах боломжтой. Мөн .oxt
файлаа олж чадахгүй байгаа бол LibreOffice-ын Mongolian spelling dictionary and hyphenation rules хуудсыг санал болгоё. Хэрэв энэ хуудас ажиллахгүй байвал миний өөрийн үүсгэсэн github агуулах уруу орж тус файлыг татаж аваарай.
Энэ дашрамд уг толь бичгийг зохиож нийтийн хүртээл болгосон Санлигийн Бадрал болон Доржготовын Батмөнх нарт талархал илэрхийлье.
Харин одоо суулгасан толь бичгээ hunspell
багцын тусламжтай хэрхэн ашиглахыг нэг жишээгээр үзүүлье.
words <- c("монгол", "хэл", "бичиг", "алдатай")
is.correct <- hunspell::hunspell_check(
words = words,
dict = hunspell::dictionary(lang = "mn_MN")
)
print(is.correct)
Уг багцын тусламжтай алдаа шалгах өргөн боломж буй бөгөөд үүнийг тус багцын баримтжуулалтаас үзэж судлах боломжтой.