當前位置:首頁 > 教育部司局機構(gòu)

立足基礎(chǔ) 突破技術(shù) 強化應(yīng)用描繪
語言文字信息化建設(shè)新藍圖

2016-10-08 來源:《光明日報》收藏

首都師范大學(xué)教授、國家語委科研基地——語言智能研究中心主任 周建設(shè)

  《國家語言文字事業(yè)“十三五”發(fā)展規(guī)劃》,是今后五年國家語言文字事業(yè)發(fā)展的重要綱領(lǐng),其在合理傳承《國家中長期語言文字事業(yè)改革和發(fā)展規(guī)劃綱要(2012—2020年)》的基礎(chǔ)上,依據(jù)國家創(chuàng)新驅(qū)動發(fā)展新戰(zhàn)略,適應(yīng)國家語言文字事業(yè)發(fā)展新需要,科學(xué)地設(shè)計了一系列基本任務(wù)和重大工程?;趪彝七M教育信息化,促進教育公平,倡導(dǎo)人人皆學(xué),處處能學(xué),時時可學(xué)的大背景,《規(guī)劃》聚焦語言資源建設(shè)、語言信息處理技術(shù)突破、語言智能成果研發(fā)與應(yīng)用,描繪了一幅語言文字信息化建設(shè)的宏偉藍圖。

  一、注重基礎(chǔ),科學(xué)規(guī)劃語言資源建設(shè)

  大數(shù)據(jù)時代,對語言文字信息化建設(shè)提出了“數(shù)據(jù)要求”。開展語言文字資源建設(shè),是應(yīng)對“數(shù)據(jù)要求”的一項基礎(chǔ)性工作?!兑?guī)劃》明確指出,語言資源是國家重要的文化資源、經(jīng)濟資源和戰(zhàn)略資源,為了加強語言資源基礎(chǔ)標準的制定,推動語言資源的共享,應(yīng)當統(tǒng)籌協(xié)調(diào),努力形成“有序開發(fā)、多元投入、社會共享”的語言資源建設(shè)與管理機制,重點建設(shè)語言文字資源庫,建設(shè)國家語言文字資源服務(wù)系統(tǒng),以促進語言文字資源的保護、開放與共享。

  廣泛收集、標注、抽取語言文字的各種要素,建設(shè)大規(guī)模語料庫,對于促進語言文字對比研究,語言信息化建設(shè)和智能化發(fā)展,以及語言文字智能化產(chǎn)品研發(fā)具有重要意義。優(yōu)質(zhì)語言數(shù)據(jù)資源共享,大大避免了資源重復(fù)建設(shè),減少了國家投入負擔(dān),提高了語言資源在全國乃至世界范圍內(nèi)的利用率,有助于發(fā)揮語言資源庫在語言文字信息化和語言智能化進程中的基礎(chǔ)性作用。

  二、突破瓶頸,準確聚焦語言技術(shù)難題

  語言信息處理是語言文字信息化和智能化發(fā)展的重要領(lǐng)域,也是語言文字信息化和智能化建設(shè)的重要途徑。無論是語言文字信息化還是語言智能化,要想取得技術(shù)創(chuàng)新的重大發(fā)展,就要找準語言信息處理的技術(shù)難點,集中科研力量,重點突破。《規(guī)劃》指出,要充分利用大數(shù)據(jù)、云計算、移動互聯(lián)網(wǎng)等新的信息技術(shù),支持自然語言深度理解、生成、處理與評價,推動語音識別與合成,文字識別,人機對話,多語種機器翻譯等智能化理論研究和關(guān)鍵技術(shù)開發(fā),推進“互聯(lián)網(wǎng)+”環(huán)境下語言智能技術(shù)創(chuàng)新,以形成標志性成果,從而在語言文字智能輔助學(xué)習(xí)和語言文字評測技術(shù)和產(chǎn)品研發(fā)方面掌握主動權(quán)。

  計算機科學(xué)、人工智能與語言學(xué)的交叉融合優(yōu)勢,為語言文字信息化和智能化提供了前提和基礎(chǔ),但機器理解人類語言還有很長的路要走。因為語言是一個復(fù)雜的系統(tǒng),每種語言,包括方言、俚語以及伴隨語言的情緒、語言交流環(huán)境等等,使得機器理解起來難度極大。云計算和大數(shù)據(jù)使人工智能由可能變?yōu)楝F(xiàn)實,豐富了慕課、微課、翻轉(zhuǎn)課堂和個性化教學(xué)等交互認知手段,突破了“教”和“學(xué)”的時空限制,實現(xiàn)了個性化反饋和有效溝通。然而,當前,智能化、個性化交互方式還有很多技術(shù)上的難題需要解決,技術(shù)難題的破解又跟基礎(chǔ)理論創(chuàng)新密切相關(guān)?!兑?guī)劃》聚焦語言文字信息化關(guān)鍵技術(shù)難題,加強語言處理的理論創(chuàng)新和技術(shù)突破,無疑將有力地促進語言文字信息化和智能化。

  三、強化應(yīng)用,全面提升語言智能服務(wù)

  隨著科技進步,人們對語言信息服務(wù)的依賴性越來越強,對語言信息服務(wù)產(chǎn)品的質(zhì)量要求越來越高。國家語言文字信息化建設(shè)的目的是強化語言文字信息化的實際應(yīng)用,不斷提升語言信息化和智能化的服務(wù)水平?!兑?guī)劃》確定“政府主導(dǎo)、語委統(tǒng)籌、部門支持、社會參與”的管理體制,并積極創(chuàng)新社會參與機制,指出要充分利用語言文字信息化和語言智能研發(fā)成果,積極整合和發(fā)揮高校、科研院所和企業(yè)的力量,吸引和扶持語言文字及相關(guān)領(lǐng)域?qū)W術(shù)團體、社會組織及志愿者等投入到語言文字信息化和語言智能化的事業(yè)中,創(chuàng)新語言文字服務(wù)方式,提升語言文字信息化和語言智能服務(wù)能力,從而為保障國家戰(zhàn)略和安全提供服務(wù)。這就為語言文字信息化和智能化工作如何高度重視用戶需求,滿足用戶需要,促進產(chǎn)品廣泛服務(wù)于國家和民生指明了方向。

(責(zé)任編輯:李娜)

版權(quán)所有:中華人民共和國教育部 中文域名:教育部.政務(wù)

京ICP備10028400號-1 京公網(wǎng)安備11010202007625號 網(wǎng)站標識碼:bm05000001