人工智能翻譯助力網文“一鍵出海”
時間:2024-01-16 02:49:58
“土生土長”的中國網絡文學已成為世界文化奇觀。根據中國作協發布的相關數據,海外用戶超過1.5億人,覆蓋200多個國家和地區。
海外閱讀需求旺盛,但相較堪稱海量的中國網絡文學而言,“出海”作品仍是少數。中國網文“出海”至今,累計輸出作品16000餘部,而僅2022年,國内新增作品就有300多萬部。每天有百萬海外讀者盯着屏幕、在線“催更”,“出海”作品“供不應求”。
翻譯是第一道關卡。篇幅巨大、作品海量,而翻譯人才不足,成為影響網絡文學更大規模走出去的重要因素。
近年來,人工智能(AI)為網文“出海”打開了一扇窗。日前,在第二屆上海國際網絡文學周上發布的《2023中國網絡文學出海趨勢報告》顯示,截至2023年10月,閱文集團旗下海外門戶起點國際已上線約3600部翻譯作品,同比三年前增長110%。在人工智能的助力下,網文的翻譯效率提升近百倍,成本降低超九成。
AI正推動網文規模化“出海”,讓“一鍵出海”“全球追更”成為可能。
翻譯效率提高3600倍,成本降到人工翻譯的1%
中文翻譯本來就難,文學翻譯更難。“信達雅”是文學翻譯的基本标準,網絡文學翻譯也不例外。
在中國社科院研究員陳定家看來,網文在翻譯上要盡量滿足三個标準:準确性、流暢性、藝術性,“網絡文學的翻譯應該盡可能準确地傳達原文的意思,包括各種語義、文化和情感内涵。譯者應該具有良好的語言表達能力,使譯文在目标語言中能被自然流暢地閱讀”。
北京大學中國語言文學系博士研究生雷甯觀察到,對北美受衆而言,太極、功夫、龍等中國元素并不陌生。然而好萊塢大片式的文化傳播與網文翻譯的本質區别在于,前者多用文化符号拼貼的方式打造“中國印象”,難以擺脫隔岸觀火的獵奇目光,後者是愛好者主動進行的文化交流行為,借由逐字逐句的翻譯來更深入地傳導文化。這無疑對譯者有很高的要求。
更新效率又關乎用戶的黏度。根據艾瑞咨詢發布的《2019年中國網絡文學出海報告》,影響海外網文用戶體驗的最主要因素是網文“出海”的效率。超八成的用戶會把“作品更新穩定,題材多樣”作為選擇平台的第一要素,他們常遇到的問題是“正在更新的小說更新太慢和突然停更”,“想看的小說沒人翻譯”。
翻譯難度大,成本也高。有業内人士表示,網絡文學請專業譯者翻譯的價格,基本是每1000字200元的報酬。而作品動辄幾百萬字,成本何其之高。即使這樣,對優秀的翻譯人才來說,也不具備吸引力,他們更願意做同聲傳譯或者金融、法律、醫療等領域的翻譯。
技術革新開辟了一條新路。2018年,國内自主研發的首個網絡文學人工智能翻譯系統推出并應用,大大提升了翻譯效率和作品“出海”數量。推文科技創始人童晔算了筆賬,AI能使翻譯效率提高3600倍。具體來說,對于1000字的翻譯,人工需要1小時,AI隻需要1秒;成本也降低到原來的1%,100萬字的專業譯者翻譯需要20萬元,AI隻需要不到1000元。
中國音像與數字出版協會副秘書長李弘表示,目前,我們已經可以借助AI将網文翻譯為英語、西班牙語、印尼語、葡萄牙語、德語、法語、日語等多種語言,不僅中國網文從中受益,海外原創網文也有了更大的傳播空間。
人工智能翻譯可以達到“理解上下文”的程度
人工智能翻譯準不準呢?童晔給出直觀答案:“100分的滿分,專業譯者可以拿到85分,AI翻譯可以拿到75~80分。”
“比方說,翻譯口語中的‘梗’,人工智能之前不行,現在可以了。”童晔說,人工智能先把“梗”變成平鋪直叙的語言,再從目标語言中尋找一種相應的“梗”,這更符合“信達雅”的翻譯要求。
精确度如何實現的呢?一些網文平台發布的資料顯示,正如人類翻譯受自身知識面的限制一樣,AI模型達到的能力範圍也受到語料範圍的限制,所以要盡可能豐富地給AI“喂料”。平台基于自然語言理解技術,對網文内容進行深入挖掘。通過對大量網文内容和優質社區内容的标注和識别,使機器更好地理解網文内容。比如,AI可以自動識别角色、場景、題材、故事脈絡等信息,構建網文的整體知識圖譜。目前,AI翻譯能夠較好地翻譯網文特殊領域中的詞、句、段落,包括人名、地名以及類似“金丹”“解藥”這種特有元素詞,還能識别出各種代詞指代的對象,盡可能避免傳統機譯中“一詞多譯”“張冠李戴”等現象。
彩雲科技CEO袁行遠解釋說,人工智能在翻譯時,會從原文中提取出人物并判斷其性别。它在判斷什麼詞是人名時,會依據一些語法規則,例如“××說”,“說”字前的名詞一般是一個人。利用類似的方式,人工智能就能獲得一張專有詞表,使得翻譯工作得以順利推進。另一方面,過去常見的“逐句翻譯”常常忽略語境,導緻翻譯結果僵硬、不知所雲,而目前的機器翻譯已經發展到“理解上下文”的程度。
不過,這隻是技術上的進步,精準翻譯具備了可能性,還無法進行規模化應用。業内人士指出,比較淺白的表述,AI可以“猜”出正确的翻譯,但遇到比較迂回的表述,比如語料中從未出現過的成語,AI猜錯的可能性就會變大。例如,“燃燈如豆”可能被直譯成“火焰像豆子”,機器無法理解深層的内涵。同時,它也不能理解故事的複雜邏輯,無法判斷前面一個伏筆會成為故事後面至關重要的因素,這都是尚需進一步探索的課題。
人工智能翻譯還離不開人的“精加工”
是否使用人工智能翻譯,不同的作家學者也有不同的理解。
人工智能追求效率提升的同時,難免會丢失文本質量、消損原著色澤。首都師範大學教授許苗苗觀察到,對于熱愛寫情節、開腦洞,不太在意風格的作者,特别是那些熱愛IP轉化,從文字作者變成編劇的作者來說,機器翻譯不成問題,而對于鐘愛自己語言風格的作者來說是緻命的,“這樣的翻譯缺乏獨特性,翻譯出來的文本隻是内容而非風格”。
地域特色翻譯、本土語境表達仍是很多作家關注的問題。陳定家指出,在翻譯的過程中,基于海量信息的大型語言處理機器,難以處理一些複雜的語言現象,如文化差異、本土語境等,隻能嚴格遵守語法規則與句式結構,無法準确傳達作者的審美趣味與情感追求,導緻扁平化的翻譯結果。
閱文集團副總裁、總編輯楊晨也把術語翻譯的準确性作為AI翻譯的首要挑戰,“像人物稱謂、門派、功法、修煉等中國網文、中國文化中特有的語言術語和表達方式,單純依靠AI翻譯無法準确表達其内涵”。
目前,人工智能翻譯還離不開人的“精加工”。中南大學教授歐陽友權認為,“人—機”協作才能保證質量。因為受目前技術水平所限,人工智能翻譯的缺點是明顯的,但“機譯”的發展方向是對的,當弱人工智能升級為強人工智能時,也許這個問題就解決了。
艾瑞咨詢發布的《2021年中國網絡文學出海研究報告》指出,現階段,通過出海服務商為内容平台提供優質的AI翻譯,加上後期的專業譯者校對潤色,優勢互補,正在幫助網絡文學快速規模化出海,特别是在2020年多語種市場布局加速的背景下,人工智能翻譯的應用能夠幫助企業快速實現語言的遷移。
楊晨表示,閱文集團組織了超過3萬人次的讀者測試及反饋,對AI翻譯的細節進行不斷地微調,使翻譯更貼近海外讀者的閱讀習慣。網文平台需要重建網文翻譯的流程和體系,搭配人工校正來綜合優化AI翻譯内容。
海外閱讀需求旺盛,但相較堪稱海量的中國網絡文學而言,“出海”作品仍是少數。中國網文“出海”至今,累計輸出作品16000餘部,而僅2022年,國内新增作品就有300多萬部。每天有百萬海外讀者盯着屏幕、在線“催更”,“出海”作品“供不應求”。
翻譯是第一道關卡。篇幅巨大、作品海量,而翻譯人才不足,成為影響網絡文學更大規模走出去的重要因素。
近年來,人工智能(AI)為網文“出海”打開了一扇窗。日前,在第二屆上海國際網絡文學周上發布的《2023中國網絡文學出海趨勢報告》顯示,截至2023年10月,閱文集團旗下海外門戶起點國際已上線約3600部翻譯作品,同比三年前增長110%。在人工智能的助力下,網文的翻譯效率提升近百倍,成本降低超九成。
AI正推動網文規模化“出海”,讓“一鍵出海”“全球追更”成為可能。
翻譯效率提高3600倍,成本降到人工翻譯的1%
中文翻譯本來就難,文學翻譯更難。“信達雅”是文學翻譯的基本标準,網絡文學翻譯也不例外。
在中國社科院研究員陳定家看來,網文在翻譯上要盡量滿足三個标準:準确性、流暢性、藝術性,“網絡文學的翻譯應該盡可能準确地傳達原文的意思,包括各種語義、文化和情感内涵。譯者應該具有良好的語言表達能力,使譯文在目标語言中能被自然流暢地閱讀”。
北京大學中國語言文學系博士研究生雷甯觀察到,對北美受衆而言,太極、功夫、龍等中國元素并不陌生。然而好萊塢大片式的文化傳播與網文翻譯的本質區别在于,前者多用文化符号拼貼的方式打造“中國印象”,難以擺脫隔岸觀火的獵奇目光,後者是愛好者主動進行的文化交流行為,借由逐字逐句的翻譯來更深入地傳導文化。這無疑對譯者有很高的要求。
更新效率又關乎用戶的黏度。根據艾瑞咨詢發布的《2019年中國網絡文學出海報告》,影響海外網文用戶體驗的最主要因素是網文“出海”的效率。超八成的用戶會把“作品更新穩定,題材多樣”作為選擇平台的第一要素,他們常遇到的問題是“正在更新的小說更新太慢和突然停更”,“想看的小說沒人翻譯”。
翻譯難度大,成本也高。有業内人士表示,網絡文學請專業譯者翻譯的價格,基本是每1000字200元的報酬。而作品動辄幾百萬字,成本何其之高。即使這樣,對優秀的翻譯人才來說,也不具備吸引力,他們更願意做同聲傳譯或者金融、法律、醫療等領域的翻譯。
技術革新開辟了一條新路。2018年,國内自主研發的首個網絡文學人工智能翻譯系統推出并應用,大大提升了翻譯效率和作品“出海”數量。推文科技創始人童晔算了筆賬,AI能使翻譯效率提高3600倍。具體來說,對于1000字的翻譯,人工需要1小時,AI隻需要1秒;成本也降低到原來的1%,100萬字的專業譯者翻譯需要20萬元,AI隻需要不到1000元。
中國音像與數字出版協會副秘書長李弘表示,目前,我們已經可以借助AI将網文翻譯為英語、西班牙語、印尼語、葡萄牙語、德語、法語、日語等多種語言,不僅中國網文從中受益,海外原創網文也有了更大的傳播空間。
人工智能翻譯可以達到“理解上下文”的程度
人工智能翻譯準不準呢?童晔給出直觀答案:“100分的滿分,專業譯者可以拿到85分,AI翻譯可以拿到75~80分。”
“比方說,翻譯口語中的‘梗’,人工智能之前不行,現在可以了。”童晔說,人工智能先把“梗”變成平鋪直叙的語言,再從目标語言中尋找一種相應的“梗”,這更符合“信達雅”的翻譯要求。
精确度如何實現的呢?一些網文平台發布的資料顯示,正如人類翻譯受自身知識面的限制一樣,AI模型達到的能力範圍也受到語料範圍的限制,所以要盡可能豐富地給AI“喂料”。平台基于自然語言理解技術,對網文内容進行深入挖掘。通過對大量網文内容和優質社區内容的标注和識别,使機器更好地理解網文内容。比如,AI可以自動識别角色、場景、題材、故事脈絡等信息,構建網文的整體知識圖譜。目前,AI翻譯能夠較好地翻譯網文特殊領域中的詞、句、段落,包括人名、地名以及類似“金丹”“解藥”這種特有元素詞,還能識别出各種代詞指代的對象,盡可能避免傳統機譯中“一詞多譯”“張冠李戴”等現象。
彩雲科技CEO袁行遠解釋說,人工智能在翻譯時,會從原文中提取出人物并判斷其性别。它在判斷什麼詞是人名時,會依據一些語法規則,例如“××說”,“說”字前的名詞一般是一個人。利用類似的方式,人工智能就能獲得一張專有詞表,使得翻譯工作得以順利推進。另一方面,過去常見的“逐句翻譯”常常忽略語境,導緻翻譯結果僵硬、不知所雲,而目前的機器翻譯已經發展到“理解上下文”的程度。
不過,這隻是技術上的進步,精準翻譯具備了可能性,還無法進行規模化應用。業内人士指出,比較淺白的表述,AI可以“猜”出正确的翻譯,但遇到比較迂回的表述,比如語料中從未出現過的成語,AI猜錯的可能性就會變大。例如,“燃燈如豆”可能被直譯成“火焰像豆子”,機器無法理解深層的内涵。同時,它也不能理解故事的複雜邏輯,無法判斷前面一個伏筆會成為故事後面至關重要的因素,這都是尚需進一步探索的課題。
人工智能翻譯還離不開人的“精加工”
是否使用人工智能翻譯,不同的作家學者也有不同的理解。
人工智能追求效率提升的同時,難免會丢失文本質量、消損原著色澤。首都師範大學教授許苗苗觀察到,對于熱愛寫情節、開腦洞,不太在意風格的作者,特别是那些熱愛IP轉化,從文字作者變成編劇的作者來說,機器翻譯不成問題,而對于鐘愛自己語言風格的作者來說是緻命的,“這樣的翻譯缺乏獨特性,翻譯出來的文本隻是内容而非風格”。
地域特色翻譯、本土語境表達仍是很多作家關注的問題。陳定家指出,在翻譯的過程中,基于海量信息的大型語言處理機器,難以處理一些複雜的語言現象,如文化差異、本土語境等,隻能嚴格遵守語法規則與句式結構,無法準确傳達作者的審美趣味與情感追求,導緻扁平化的翻譯結果。
閱文集團副總裁、總編輯楊晨也把術語翻譯的準确性作為AI翻譯的首要挑戰,“像人物稱謂、門派、功法、修煉等中國網文、中國文化中特有的語言術語和表達方式,單純依靠AI翻譯無法準确表達其内涵”。
目前,人工智能翻譯還離不開人的“精加工”。中南大學教授歐陽友權認為,“人—機”協作才能保證質量。因為受目前技術水平所限,人工智能翻譯的缺點是明顯的,但“機譯”的發展方向是對的,當弱人工智能升級為強人工智能時,也許這個問題就解決了。
艾瑞咨詢發布的《2021年中國網絡文學出海研究報告》指出,現階段,通過出海服務商為内容平台提供優質的AI翻譯,加上後期的專業譯者校對潤色,優勢互補,正在幫助網絡文學快速規模化出海,特别是在2020年多語種市場布局加速的背景下,人工智能翻譯的應用能夠幫助企業快速實現語言的遷移。
楊晨表示,閱文集團組織了超過3萬人次的讀者測試及反饋,對AI翻譯的細節進行不斷地微調,使翻譯更貼近海外讀者的閱讀習慣。網文平台需要重建網文翻譯的流程和體系,搭配人工校正來綜合優化AI翻譯内容。
(劉江偉)