My Natural Language Processing

My Natural Language Processing

Share

I have a passion to development NLP Tools, Application in Myanmar Language. I am trying for that all the time.

27/12/2020

My NLP Page ကို 2021 ကစပြီး ပြန်လည် အသက်သွင်းပါမယ်။ မည်သူမဆို ဝင်ရောက်ဆွေးနွေး မေးမြန်းတိုင်ပင်နိုင်ပါတယ်။
ဆွေးနွေးချင်တဲ့ မည်သည့်အကြောင်းအရာမဆို AI/NLP/ML/Data Science ပိုင်းတွေကို အဓိက ထားပြီး မျှဝေကြပါမည်။

16/04/2020

April 16-2020, tonight
8:00 PM
👏👏👏👏👏👏👏👏👏👏👏👏

23/12/2019

Android developer
အတွေ့အကြုံ 5 နှစ် နှင့် အထက်။ API လည်းရေးနိုင်ရပါမယ်။
Team leading ရရမည်။
လစာ ၁၀ သိန်း ( အထက် ညှိနှိုင်း)
UMG Myanmar.
ဆက်သွယ်ရန် 095198550
[email protected]

01/04/2019

Machine Learning (ML) ဆိုတာ Natural Language Processing (NLP) အတွက် မသိမဖြစ်၊ မရှိမဖြစ်လိုအပ်တဲ့နည်းပညာ ဆိုပေမဲ့၊ ML သိတာလောက်နဲ့ NLP မဖြစ်ဘူးဆိုတဲ့ အကြောင်း ဆွေးနွေးချင်ပါတယ်။
Language Processing တစ်ခုရဲ့ အနှစ်သာရကတော့ ဘာသာဗေဒ ပါပဲ။

06/02/2019

UMGIdealab, Myanmar မှ အောက်ပါ ရာထူးအတွက် ညှိနှိုင်းလစာနှင့် အတူ၊ သင်၏ အရည်အချင်းများ အထူး အသုံးချနိုင်သော၊ ပိုမိုတိုးတတ်စေနိုင်သော အခွင့်အလမ်းများအတွက် အမြဲဖိတ်ခေါ်နေပါသည်။

09/11/2018

ဒီပေ့ချ့် မှာ Natural Language Processing နဲ့ ပတ်သတ်ပြီးလာရောက်မျှဝေပေးကြဖို့ လေးစားစွာ ဖိတ်ခေါ်ပါတယ်။ မြန်မာ NLP နဲ့ ပတ်သတ်ပြီး၊ မိမိလေ့လာထားသမျှ၊ ကြိုးပမ်းထားသမျှ၊ သိလိုသမျှကို ပွင့်ပွင့်လင်းလင်း ရိုးရိုးသားသား ဝေမျှ မေးမြန်းနိုင်ပါတယ်။ ကျေးဇူးအထူးတင်ရှိပါသည်။

Photos from My Natural Language Processing's post 10/05/2018

Burmese Word Segmentation (Part-1)
ပထမဆုံးအနေနဲ့ "word segmentation" ဆိုတာ ဘာလဲဆိုတာကို ဦးစွာ ဆွေးနွေး လိုပါတယ်။
အလွယ်ကူဆုံး အရှင်းဆုံး ပြောရရင်တော့ ဘာသာစကားများတွင် စာရေးသားတဲ့ အခါမှာ ဖတ်ရပိုမိုလွယ်ကူစေရန်နှင့် စကားလုံးများ ရောထွေးမှုမရှိစေရန် အဖြတ်အတောက်များထား၍ ရေးသားကြသည်။ Digital ခေတ်ရောက်လာသောအခါ "space" တစ်ချက်၊ word တစ်လုံးလို့ ဆိုရိုးပြုကြပါတယ်။ နမူနာအားဖြင့် ဂျပန်၊ တရုတ်နှင့် မြန်မာကို ယှဉ်တွဲပြထားပါသည်။
အောက်ပါပုံနှစ်ပုံမှ မြန်မာစာနှင့် ရေးထားသော ပုံထဲမှ စာများ၏ အဖြတ်အတောက်များ ကို real word segmentation လို့ ဆိုနိုင်ပါသလား? ဆိုတာ လက်ဆက်ဆွေးနွေးကြပါစို့။

10/05/2018

NLP အကြောင်း မရေးတာ၊ မမျှတာကြာပြီဖြစ်လို့၊ အခု ပြန်ရေးတဲ့အထိမ်းအမှတ်အနေနဲ့ မြန်မာ (ဗမာစာ) စကားဖြတ်၊ ပုဒ်ဖြတ် အကြောင်း ဆွေးနွေးချင်ပါတယ်။ တနည်းအားဖြင့် Burmese Word and Phrase Segmentation အကြောင်းဖြစ်ပါတယ်။ နည်းပညာ၊ သီအိုရီတွေကို ခဏမေ့ပြီး ဘာသာဗေဒနည်းနဲ့ ဆွေးနွေးမယ်ဆို ပို၍ကြိုဆိုပါတယ်။

26/09/2017

I would like to discuss about sentiment analysis for a MM language.
Whoever can join here.

14/06/2016

Machine Learning Technique and Natural Language Processing
*************************************************************************
Machine Learning Technique ဆိုတာ NLP ရဲ့ အရေးကြီးတဲ့ လုပ်ငန်းစဉ်တွေမှာ မသိမဖြစ်လိုအပ်လာတဲ့ နည်းပညာ (သို့မဟုတ်) ချည်းကပ်နည်းတခုလို့ဆိုရပါတယ်။
အဓိကအားဖြင့် မိမိဘာသာစကားကို အသုံးပြုပြီး Processing တွေ လုပ်ဖို့၊ ဘာသာဗေဒနဲ့ ပတ်သတ်တဲ့ rule တွေကို တည်ဆောက်ရတဲ့အခါ လိုအပ်တဲ့ ဘာသာဗေဒ အချက်အလက်တွေကို Training Data Set အဖြစ် တည်ဆောက်ရပါတယ်။ ၎င်း Train Data set တွေဟာလည်း statistical approach ကို အသုံးပြုမယ်ဆိုရင် Machine Learning ကို သေချာပေါက် အသုံးပြုရတော့မှာဖြစ်ပါတယ်။
နားလည်အလွယ်ဆုံး ပြောရရင်တော့ Machine Translation လို စနစ်မျိုးတည်ဆောက်တဲ့ အခါ Pattern based, Dictionary based စတဲ့ approach တွေနဲ့ တည်ဆောက်မယ်ဆိုရင် Machine Learning ကို သုံးစရာမလိုအပ်သေးပါဘူး။
သို့ပေမဲ့ Corpus သုံးပြီး statistical Machine Translation ကို တည်ဆောက်မယ်ဆိုရင်တော့ သေချာပေါက် Machine Learning Technique ကို အသုံးပြုရပါတယ်။
ထို့ပြင် NLP ရဲ့ လုပ်ငန်းစဉ်တွေထဲမှာ Information Extraction အပိုင်းကိုလုပ်တဲ့အခါ "Name Entities Recognition" နဲ့ Entity တခုချင်းစီရဲ့ ဆက်နွယ်ပုံတွေကို Machine Learning ကိုသုံးပြီး ဘာသာစကားရဲ့ အချက်အလက်တွေ၊ ဆက်နွယ်ပုံတွေကို Recognize လုပ်ရပါတယ်။
Natural Language Processing အလုပ်နဲ့ ပတ်သတ်ပြီး Engine တွေ၊ Tool တွေနဲ့ Software တွေတည်ဆောက်တဲ့ အခါ ဘာသာဗေဒ (linguistic) အရ အလွန်အရေးကြီးတဲ့ လုပ်ငန်းကြီးဖြစ်တဲ့ Part of Speech (POS) Tagging နဲ့ Parsing တွေမှာဆို Machine Learning Technique ဟာ အလွန်မှာ အရေးပါလွန်းလှပါတယ်။
(MLT+NLP အကြောင်းကို ဆက်လက် ဖော်ပြပေးသွားပါအုံးမယ်၊ မိမိအကြုံကို မျှလိုသူများနှင့် ဆွေးနွေးလိုသူများကို ဖိတ်ခေါ်ပါတယ်။)

The Linguist's Shoebox: Multi-Dictionary Formatter (MDF) 13/06/2016

If you have to learn about Lexicon , you might know about MDF as a linguist.

The Linguist's Shoebox: Multi-Dictionary Formatter (MDF) Computer software that provides integrated data management and analysis for the field linguist

28/05/2016

Statistical machine translation (SMT) and translation memories
************************************************************************(TM)
******
Two technological advances in the field of automated language translation, translation memory (TM) and statistical machine translation (SMT),have seen vast progress over the last decades, but they have been developed very much in isolation.
"TMs" are a tool for human translators. Since many translation needs are highly repetitive (translation of updated product manuals, or several drafts of leg-islation), being able to find existing translations of segments of the source language text, alleviates the need to carry out redundant translation. TM have addressed the need of translation agencies
to produce high-quality translations of often repetitive material, SMT has set itself the challenge of open domain translations such as news stories and is mostly satisfied with translation quality that is good enough for girting, i.e., transmitting the meaning of the source text to a target language speaker.

Want your business to be the top-listed Gym/sports Facility in Yangon?
Click here to claim your Sponsored Listing.

Address

Yangon