紙引未來
 
當前位置: 首頁 ? 資訊 ? 印刷新聞 ? 正文

我國傳統蒙古文印刷體文字識別軟件研究取得重大進展

放大字體??縮小字體 發布日期:2016-11-30??來源:互聯網??作者:紙引未來??瀏覽次數:522
核心提示:
我國傳統蒙古文印刷體文字識別軟件(OCR)研究取得重大進展。據其研發者烏日力嘎博士向新華網內蒙古頻道獨家披露,目前OCR軟件對蒙古文白體的識別率已達到99%以上,對鉛印版的識別率也達到95%以上。

隨著互聯網的高速發展,網絡已經成為人們共享信息的一個大平臺。“在信息共享的大平臺之中,蒙古文信息的傳播因為數字化處理的識別限制,變得極為繁瑣和無奈。”畢業于內蒙古大學的烏日力嘎博士直言不諱。

“傳統蒙古文有大量的圖書、報刊,但其中很多都沒有實現數字化,”烏日力嘎博士介紹說,高效數字化需要OCR(Optical Character Recognition)軟件自動識別掃描或拍照的圖片,將圖片中的文字轉換成文本。

據了解,本世紀初伊始,就陸續有科研機構、相關公司嘗試開發傳統蒙古文自動識別軟件,但因為識別準確率不高、操作繁瑣等諸多原因,使用者至今未能等到可廣泛使用和可信賴的產品。烏日力嘎博士卻憑借自己的執著追求和一己之力,用不到兩年時間完成了這一傳統蒙古文印刷體OCR。

“讀博士期間研究機器翻譯,機器翻譯需要大量的語言資源,但是蒙古文的資源特別少,我們在建立語言數據庫時需要大量的人力、時間和經費,”烏日力嘎博士說:“從那個時候起,我就萌發一個念頭,自己是否也試著研發一款高精度的蒙古文自動識別系統。”

2015年夏天博士畢業之后,烏日力嘎開始全身心地投入到傳統蒙古文OCR軟件的開發之中,她參考了國內外大量學術文獻,并使用深度學習和語言模型等高新技術,在短時間內成功研發出了蒙古文高精度自動識別軟件。據介紹,這一軟件的優勢是既能識別掃描圖片,又能識別拍照的圖片,并且將打字和校對的功能融為一體。

“上世紀90年代以前的書本都是鉛印版本,但目前還沒有其他可以把鉛印版轉換成文本的軟件,而烏日力嘎博士研究的軟件優勢是能識別鉛印版,并且有承前啟后的作用,”內蒙古大學教授那順烏日圖認為,烏日力嘎研究的軟件理論上有創新,這一軟件結合語言規則和統計方法,再利用深度學習和神經網絡等新技術來完成的。因為以前的OCR軟件是基于規則或者是基于統計的方法來實現的,他們最終效果都不理想。

烏日力嘎最后表示,希望她所開發的這款軟件能為廣大的蒙古語言文字工作者帶來更多的工作上的便利。

?



【免責聲明】

1、紙引未來發布此信息目的在于傳播更多信息,與本平臺網站立場無關。

2、紙引未來不保證該信息(包括但不限于文字、數據及圖表)全部或者部分內容的準確性、真實性、完整性、有效性、及時性、原創性等。

3、如有侵權請直接與作者聯系或書面發函至本公司轉達,及時給予刪除等處理。

?
[ 資訊搜索 ]? [ 加入收藏 ]? [ 告訴好友 ]? [ 打印本文 ]? [ 違規舉報 ]? [ 關閉窗口 ]

?
0條 [查看全部]  相關評論

?
推薦圖文
推薦資訊
點擊排行
 
主站蜘蛛池模板: 久久99久久99精品免观看| 久久无码中文字幕免费影院| 亚洲日韩精品无码专区加勒比海| 亚洲美女国产精品久久久久久久久| 国产香蕉国产精品偷在线| 久久亚洲色www成人男男| 隔壁人妻被水电工征服| 久久久久青草线蕉亚洲| 国产亚洲精品久久av| 99re视频热这里只有精品38| 精品午夜中文字幕熟女人妻在线| 久久午夜私人影院| 亚洲呦女专区| av动漫无码不卡在线观看| 久久精品99久久香蕉国产| 精品第一国产综合精品蜜芽| 亚洲а∨天堂2019在线无码| 国产人妻精品区一区二区三区| 狠狠色丁香婷婷综合尤物| 另类内射国产在线| 亚洲а∨天堂久久精品9966| 国产午夜人做人免费视频网站| 狠狠综合久久久久尤物| 狠狠热在线视频免费| 亚洲第一无码精品立川理惠 | 免费人成网站在线视频| 2021最新久久久视精品爱| 国产精品极品美女自在线观看免费| 日韩在线不卡免费视频一区| 亚洲色欲网熟女少妇| 国产成_人_综合_亚洲_国产绿巨人| 国产精品亚洲a∨天堂不卡| 久久99精品久久久久久青青| 8x国产精品视频| 久久久午夜成人噜噜噜| 色综合天天综合天天更新| 日韩精品免费一线在线观看| 国产亚洲日韩网曝欧美台湾| 免费无码又爽又刺激毛片| 久久www免费人成一看片| 大胸美女被吃奶爽死视频|