- 翻譯公司資訊
-
“譯者”在人工智能時代扮演的角色
發布時間:2017-08-30 09:48 點擊:
現代語音識別和自然語言處理研究的先驅、美國工程院院士Frederick Jelinek曾經有句名言:“Every time I fire a linguist, the performance of the speech recognizer goes up.”(我每開除一位語言學家,我的語言識別系統性能就會提升。)Unitrans世聯翻譯公司在您身邊,離您近的翻譯公司,心貼心的專業服務,專業的全球語言翻譯與信息解決方案供應商,專業翻譯機構品牌。無論在本地,國內還是海外,我們的專業、星級體貼服務,為您的事業加速!世聯翻譯公司在北京、上海、深圳等國際交往城市設有翻譯基地,業務覆蓋全國城市。每天有近百萬字節的信息和貿易通過世聯走向全球!積累了大量政商用戶數據,翻譯人才庫數據,多語種語料庫大數據。世聯品牌和服務品質已得到政務防務和國際組織、跨國公司和大中型企業等近萬用戶的認可。 專業翻譯公司,北京翻譯公司,上海翻譯公司,英文翻譯,日文翻譯,韓語翻譯,翻譯公司排行榜,翻譯公司收費價格表,翻譯公司收費標準,翻譯公司北京,翻譯公司上海。
人們有時候會誤讀這句話,認為在自然語言處理技術發展的進程中,語言專家的作用微乎其微,拯救世界的任務還得落在程序員身上。
我去專門查過Frederick Jelinek大牛的維基百科介紹,里面有段話很有意思(注意粗體加下劃線的部分):
“Although its fame and iconic status are undisputed (it was for example used as the title of a 1998 speech by Julia Hirschberg), its context is unknown and its specific wording and dating are unclear. According to Daniel Jurafsky and James H. Martin, Jelinek himself recalled the quote as "Anytime a linguist leaves the group the recognition rate goes up" and dated it to December 1988 (Wayne, Pennsylvania), further noting that the quote did not appear in the published proceeding,[2][3] whereas Roger K. Moore gave the wording as "Every time we fire a phonetician/linguist, the performance of our system goes up" and dated it to an IEEE Automatic Speech Recognition and Understanding workshop held in 1985.[4] According to Steve Young, "the story goes that one day one of his linguists resigned, and Fred decided to replace him not by another linguist but by an engineer. A little while later, Fred noticed that the performance of his system improved significantly. So he encouraged another linguist to find alternative employment, and sure enough performance improved again."”
思考
自然語言處理專家嘴邊經常提及這句話,搞機器翻譯技術的專家也時不時拿這句話調侃一下。如今很多機器翻譯團隊里并沒有所謂的“語言學家”(Linguist),不需要任何語言學家就能搭建一套高效能的機器翻譯程序,產出他們眼中高質量的機器翻譯譯文,發布令他們興奮不已的成果。
而令他們興奮不已的論文數據又會令媒體記者的雙手顫抖不已,寫下驚天地泣鬼神,令翻譯人員聞字喪膽的熱文。
但以下新聞引發了我的思考:
新聞一:
《谷歌:用算法和大數據“干掉”語言學家》
時間:2013年9月25日
摘要:
谷歌是一家極度看重算法、充滿工程師文化的公司,但或許你還是會為此而感到驚奇——他們認為翻譯是一個數學和統計學方面的問題。最近,位于谷歌總部的谷歌翻譯團隊正迅速擴張,他們新招了數名德國計算機科學家,但卻沒有招收一名語言學家。
新聞二:
《實現無監督學習?谷歌雇百名語言學家為訓練數據“鍍金”》
時間:2016年12月01日
摘要:
谷歌組織了一個由大量語言學博士組成團隊,它把這支團隊稱為“Pygmalion”,使用這些語言學家人工篩選的數據來訓練神經網絡。實際上,谷歌的機器通過觀察人類的做法來學習如何從長段落中提取相關答案,這個過程需要重復多遍,相當漫長。這些艱苦的努力同時證明了深度學習的能力和局限性。為了訓練像這樣的人工智能系統,需要大量的、由專業人士篩選過的數據。這些數據不容易得到,也不便宜,而且對這種數據的需求不會很快消失。
新聞三:
《特寫 | 人工智能背后的人》
時間:2017年4月7日
摘要:
秦嬌今年剛滿 30 歲,幾個月前剛剛從呼叫中心跳槽到一家「數據加工」公司。雖然跨了行業,她并不覺得兩份工作有什么不同,都是按照甲方的要求和己方的工作節奏,把人手安排到一個又一個項目中去。
公司剛成立不到一年,眼下業務大多是標注數據,即根據項目方要求,人工為圖片、視頻和語音內容打標簽、做標記。標注好的數據會被人工智能公司用來訓練算法模型,然后應用到圖像識別、語音識別等不同領域。
「數據加工」公司所在地距「大數據之城」貴陽五十多公里,是一座只接受科技公司入駐的「數字小鎮」。
小鎮的隔壁有一間規模不小的高職學校,學校的學生構成了這家公司目前主要的員工來源。高職學校初建的目的是教育扶貧,因此學生們大多來自貧困山區,學校會提供不少補助和獎學金。在數據加工公司兼職賺來的錢不僅足夠生活,有些學生還會拿出一部分補貼家用。偶爾這份工作還能成為職業跳板,「我們的學生踏實又努力,有的去北京實習,因為熟悉標注工作、又認真,反饋回來說比同樣實習的北京大學生強得多」。
除此之外,她們還可以承接小語種的語料收集工作。地處西南、臨近東南亞,當地的人際關系鏈和頻繁的商務交往能提供不少便利。
我不知道諸位讀者看到這三條新聞后是什么樣的感受?我的感受是這樣的:
嚴格意義上來說,“語言學家”、“語言專家”、“語言學博士”與“翻譯學家”、“翻譯家”、“翻譯專家”、“翻譯學博士”是兩個圈子的人。我如果說“我身邊最牛的翻譯根本不知道語言學是什么”,你信嗎?我如果說“做翻譯根本不需要語言學知識”,你信嗎?我如果說“現在的翻譯專業學生根本不需要《語言學》”,你信嗎?
機器翻譯研發團隊之所以沒有大牛翻譯,并不是因為翻譯人員沒有作用,而是因為他們已經過氣了,機器翻譯研發團隊手里拿來訓練機器翻譯程序的“語料/數據”是哪兒來的?還不是一堆他們并不知道名字的譯者一個字一個字翻譯出來的,但翻譯完就完了,他們并不清楚自己的譯文以后會起到什么作用,以為只是作為“作品”被陌生讀者閱讀罷了。
谷歌之所以又需要語言學博士來標注數據了,并不是因為他們的技術沒有作用,而是因為他們手里的數據不夠用了,需要由人來補充新的更高質量的數據。而機器翻譯研發團隊還沒有開始招募“語言學博士”、“翻譯學博士”,是因為人翻譯的速度太慢了,價格又太貴了,短時間內提供的高質量的雙語數據對機器翻譯程序性能的提升并沒有太大提升,而直接從第三方公司手中買廉價的雙語數據或者自己寫程序去抓取免費的雙語數據則更劃算一些。
標注數據這種工作跟富士康流水線上裝配手機的工作一樣,“惡心但必需”。“人工智能”時代,耗費多少“人工”,就有多么“智能”。
譯者通常認為自己產出的“雙語平行文本”沒有什么用,但通過技術可以進一步挖掘雙語平行文本中的諸多信息,比如雙語術語、語義信息、句法信息等。那些年長的譯者花幾十年從雙語文本中靠經驗挖掘出來的“知識”可能遠不及計算機程序幾秒鐘挖掘出來的的信息。
那人工智能時代,“譯者”究竟扮演著什么樣的角色?在我看來,只要世界不停轉,譯者就有翻譯不完的文字,只要有翻譯不完的文字就有賺不完的錢,所以譯者的生存問題是不會受到影響的。
但,在今天的翻譯行業生態環境下,“譯者”也要順應適者生存、優勝劣汰的法則,總有人因為不適應人工智能時代工作模式的變革而被淘汰,也總有人會在人工智能時代找到駕馭技術迎難而上的突破口。
人工智能時代,聰明的“譯者”要做一個“變革者”,熟悉技術、擁抱技術、使用技術。但在這個過程中,譯者其實處于非常弱勢的位置,因為最終改變譯者命運的不是譯者自己,而是為譯者提供技術服務的開發者。因此,聰明的“譯者”還要做一個“合作者”,熟悉提供技術服務的人、使用他們提供的技術。
結語
人工智能時代,年輕一代譯者的價值應當在兩方面凸顯,一方面是自身的翻譯水平,另一方面是自身的技術認識。老一輩的譯者可以在翻譯水平方面引領年輕一代譯者的發展,但不能冥頑不化,令年輕一代錯失認識技術的良機。“技術”包羅萬象,年輕一代譯者并不需要樣樣精通,也絕無可能,需要有人引領年輕一代譯者認識對其有價值的真技術。
作為年輕一代譯者,被機器翻譯專家開除并不可怕,可怕的是被翻譯專家開除。- 上一篇:論英語閱讀諸變量對閱讀的影響
- 下一篇:口譯員如何提升記憶力