當(dāng)前位置：協(xié)會(huì)首頁(yè) > 企業(yè)資訊 > 力維智聯(lián)榮獲“中文文本糾錯(cuò)比賽”第三名

力維智聯(lián)榮獲“中文文本糾錯(cuò)比賽”第三名

時(shí)間:2021-10-28 10:17:44 來(lái)源:安防行業(yè)協(xié)會(huì) 作者:未知

近日，由我國(guó)智能科學(xué)技術(shù)領(lǐng)域權(quán)威學(xué)會(huì)中國(guó)人工智能學(xué)會(huì)主辦的“第三屆中國(guó)‘AI+’創(chuàng)新創(chuàng)業(yè)大賽”完美收官。在“自然語(yǔ)言處理技術(shù)創(chuàng)新大賽——中文文本糾錯(cuò)比賽”賽道中，力維智聯(lián)Sentosa團(tuán)隊(duì)從眾多企業(yè)和高校團(tuán)隊(duì)中脫穎而出，獲得了大賽第三名，前兩名分別是蘇州大學(xué)&阿里巴巴達(dá)摩院聯(lián)合團(tuán)隊(duì)、清華大學(xué)團(tuán)隊(duì)。

在新聞出版行業(yè)，由于出版種類(lèi)和數(shù)量的大幅增長(zhǎng)、傳播渠道的多樣化、知識(shí)替代和更新的日益加速，以及中國(guó)語(yǔ)言文字的靈活性等原因，審校工作難度越來(lái)越大。而內(nèi)容質(zhì)量又是出版物的靈魂所在，如果完全由人工進(jìn)行編校質(zhì)量把關(guān)，勢(shì)必影響工作效率。

此次文本校對(duì)任務(wù)主要是針對(duì)文本中出現(xiàn)的錯(cuò)誤進(jìn)行檢測(cè)和糾正，屬于綜合性的自然語(yǔ)言處理研究子方向，能夠比較全面地體現(xiàn)自然語(yǔ)言處理的技術(shù)水平。賽題主要選擇互聯(lián)網(wǎng)上中文母語(yǔ)寫(xiě)作者撰寫(xiě)的網(wǎng)絡(luò)文本作為校對(duì)評(píng)測(cè)數(shù)據(jù)，從拼寫(xiě)錯(cuò)誤、語(yǔ)法錯(cuò)誤、語(yǔ)病錯(cuò)誤等多個(gè)方面考察機(jī)器的認(rèn)知智能能力。

針對(duì)比賽任務(wù)，力維智聯(lián)依托Sentosa數(shù)據(jù)科學(xué)與機(jī)器學(xué)習(xí)平臺(tái)（DSML），以預(yù)訓(xùn)練模型BERT和ELECTRA為基礎(chǔ)，通過(guò)對(duì)拼寫(xiě)、語(yǔ)法、標(biāo)點(diǎn)錯(cuò)誤的任務(wù)分解與模型串聯(lián)進(jìn)行訓(xùn)練與預(yù)測(cè)。在這個(gè)過(guò)程中，Sentosa團(tuán)隊(duì)針對(duì)語(yǔ)法與標(biāo)點(diǎn)錯(cuò)誤，提出兩種不同的數(shù)據(jù)增廣方式，提升了數(shù)據(jù)質(zhì)量，也提高了模型的泛化能力。

力維智聯(lián)基于Sentosa平臺(tái)，依據(jù)行業(yè)規(guī)范、標(biāo)準(zhǔn)和業(yè)務(wù)知識(shí)，開(kāi)發(fā)出智能審校產(chǎn)品，輔助用戶(hù)快速準(zhǔn)確發(fā)現(xiàn)文稿中的字詞錯(cuò)誤、語(yǔ)法錯(cuò)誤、標(biāo)點(diǎn)錯(cuò)誤等問(wèn)題，幫助用戶(hù)提升校對(duì)質(zhì)量及審稿效率，確保內(nèi)容安全生產(chǎn)。后續(xù)，力維智聯(lián)將充分利用人工智能大數(shù)據(jù)技術(shù)，在文本糾錯(cuò)、知識(shí)提取、古文句讀等方面持續(xù)發(fā)力，促進(jìn)中文自然語(yǔ)言技術(shù)發(fā)展，助力出版行業(yè)數(shù)字化轉(zhuǎn)型。

上一篇：力維智聯(lián)入選《2021企業(yè)數(shù)智化轉(zhuǎn)型升級(jí)服務(wù)全景圖/產(chǎn)業(yè)圖譜》
下一篇：CPSE安博會(huì)延期，線(xiàn)上觀展一樣精彩

企業(yè)資訊

: 共繪藍(lán)圖，2024熵基科技全球合作伙伴大會(huì)圓滿(mǎn)成功; 近日，以“共繪藍(lán)圖”為主題的2024熵基科技全球合作伙伴大會(huì)在東莞成功落下帷幕。作為熵基科技規(guī)模最大、面向全球全品類(lèi)核心伙伴的頂

: 一文讀懂熵基國(guó)密門(mén)禁; 在數(shù)字化轉(zhuǎn)型的洪流中，信息安全不僅是企業(yè)穩(wěn)健運(yùn)營(yíng)的基石，更是公共部門(mén)安全無(wú)虞的保障。隨著數(shù)據(jù)價(jià)值的日益凸顯，其保密性和安全性成為

: 門(mén)禁“隱形冠軍”？是時(shí)候重新認(rèn)識(shí)熵基科技了; 在智慧出入口與身份識(shí)別、辦公等領(lǐng)域深耕多年的熵基科技，早已不局限于傳統(tǒng)的門(mén)禁與考勤系統(tǒng)，而是悄然邁入了智能物聯(lián)（AIoT）的廣闊

項(xiàng)目活動(dòng)

會(huì)員專(zhuān)區(qū)