推動科技創(chuàng)新 發(fā)展語言智能
發(fā)展語言智能是推動語言文字信息技術創(chuàng)新,扶持語言產(chǎn)業(yè)發(fā)展的重要任務,也是語言科技工作者的神圣使命。
增強創(chuàng)新意識
語言智能是語言文字信息技術創(chuàng)新發(fā)展的時代產(chǎn)物。發(fā)展語言智能必須增強科學意識,深刻認識語言智能的科學原理,深入研究語言智能。語言智能基于人腦生理屬性、言語認知路徑、語義生成規(guī)律,利用大數(shù)據(jù)與人工智能技術,對語言信息進行標注、抽取、加工、存儲和特征分析,構擬人機語義同構關系,讓機器實施類人言語行為,即讓機器說話、寫作、翻譯、評測,實現(xiàn)人機語言交互。
語言智能研究應當類腦智能和計算智能二者兼顧。從語言智能角度研究類腦智能,應研究言語神經(jīng)元特性、神經(jīng)回路與大腦功能、神經(jīng)元運作生理屬性;探索人腦對語言符號的加工、記憶、聯(lián)結、言語情感激發(fā)和言語輸出規(guī)律;研究言語活動的問題與言語障礙治理。從人腦角度研究語言智能,難度很大,需要生命科學、腦科學、認知科學、心理學、醫(yī)學、語言學等多學科交叉協(xié)同攻關。
從計算角度研究語言智能,應研究語言的符號標注、語音處理、文字識別、語塊疊加、句子生成、篇章生成、語義分析、情感計算、語言理解、機器翻譯、語言測評等。研究難點在于語義計算和情感計算。語義計算需要突破靜態(tài)語義多義素選擇與動態(tài)語義的不確定性計算難題,情感計算需要對多樣態(tài)語音、個性化文字、面部表情表征顆粒以及腦電心電反應特征等進行結構化處理與精準計算。
資源庫建設是語言智能研究的基礎。需要依據(jù)國家語言文字發(fā)展戰(zhàn)略,圍繞語言智能發(fā)展目標,確定資源建設任務,做好頂層設計,評估建設難度,協(xié)同多方力量,分步組織實施。只有經(jīng)過科學加工的語言數(shù)據(jù)才能有效助力語言智能研究,提升語言智能研究品質(zhì)。
注重成果轉化
資源建設、理論研究和技術研發(fā)成果,最終要轉化成語言智能產(chǎn)品,為社會提供語言智能服務。
我國通用語言文字推廣普及工作取得了巨大成效,但一些偏遠貧困地區(qū)的普通話水平仍不理想,與外部地區(qū)仍存在交流困難,影響先進信息的接受,妨礙地區(qū)經(jīng)濟發(fā)展。這就需要語言智能,尤其是智能語音技術,輔助提升普通話推廣的精度、速度和效率。
語言能力是人的認知力、思維力、邏輯力、創(chuàng)造力和表達力的綜合體現(xiàn)。如何提高語言能力,是對語言智能提出的挑戰(zhàn)性問題。這需要采集相應數(shù)據(jù),科學分析個人的知識基礎、學科傾向、思維類型、能力潛質(zhì),分析經(jīng)驗積累和知識攝取狀況,通過智能技術手段,測評實際水準,推薦個性化知識學習內(nèi)容,并輔助個性化語言能力訓練。
語言智能具有文化傳承的服務優(yōu)勢。語言是文化載體,語言精神反映民族精神。從浩瀚的古典文獻中精選優(yōu)秀傳統(tǒng)文化素材,從當下日新月異的語言信息洪流中洗練文化精華,傳遞給當代國人,需要語言智能獨特的算力。從既有的語言文字數(shù)據(jù)中分析發(fā)現(xiàn)文化素養(yǎng)和家國情懷,精準實施優(yōu)秀文化教育,可以成為語言智能的常態(tài)服務。
目前,語言智能服務仍處于細分領域的單點突破階段。發(fā)展語言智能,不但要貢獻當下,更要關注未來。應當在基礎理論、關鍵技術、產(chǎn)品研發(fā)及場景應用上持續(xù)發(fā)力,不斷開發(fā)用戶體驗良好、優(yōu)質(zhì)高效的語言智能產(chǎn)品,廣泛服務社會,服務全人類。(作者:周建設 中國語言智能研究中心主任)
版權聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關法律責任。
-
呵護漢字 傳承文明
世界文字類型豐富多樣,或古老,或年輕,或自源,或他源,其中漢字無疑是世界上最為獨特的文字之一。[詳細] -
語言能力建設的宗旨是服務國家發(fā)展
我國需要對世界語言及其應用做更多研究和探討,擁有與大國地位相當?shù)恼Z言文字知識和話語權。[詳細] -
堅定不移推廣普及國家通用語言文字
我國是統(tǒng)一的多民族多語言國家,普通話和規(guī)范漢字是我國的國家通用語言文字,推廣國家通用語言文字是我國的基本語言政策。[詳細]