【翻牆問答】為何ChatGPT中文提問答案會比英文來得差?

2023.06.30
【翻牆問答】為何ChatGPT中文提問答案會比英文來得差? 現時中國人使用ChatGPT一類人工智慧技術,有一個很嚴重問題,就是中文ChatGPT的答案水準與英文相比,距離差天共地。
路透社資料圖片

問:現時中國人使用ChatGPT一類人工智慧技術,除了遇上美國Open AI等公司故意封鎖中國用戶的問題外,還有一個很嚴重問題,就是中文ChatGPT的答案水準與英文相比,距離差天共地,為何會出現這個現象? 

李建軍:ChatGPT背後的大語言人工智慧模式,中國或者有一流的技術人員,如果同樣的Open AI模式,中文答案的水準與英文無法相比,這個不是硬件或模型問題,而是人工智慧系統到底靠甚麼資料來學習的問題。因為人工智慧系統,與一般人一樣,並非一開始就無所不知,都必須要經過不斷的學習,然後才建立到自己的知識系統去作出判斷,回應你的問題。 

英文ChatGPT的資料來源,其中一部分當然是維基百科英文,另一部分是一些公開的資料抓取項目,他們由全球各地不同的傳媒、討論區、推特、臉書等內容建立一個龐大資料庫,去讓機器學習各類不同的知識。因此,中文世界是否有一個自由的討論空間,自由的傳媒,自由的學術環境,以及自由的網絡,就變成了一大關鍵。而中國並不具備這種環境,當中文世界的討論區、微博等環境可以隨便刪文的時候,你的學習內容,就已經處於先天的劣勢。 

原本中文世界有海外華人的網絡、還有香港和台灣,只不過,香港的自由環境,已經被國安法完整地摧毀,《蘋果日報》、《香港電台》等傳媒累積的資料庫被香港政府任意破壞,基本上已經少了很多資料讓機器去學習。中國當局為了控制輿論,還花費大量金錢聘請網絡評論員,在各大海外論壇、YouTube頻道甚至維基百科中文等去搞破壞,再加上大量中文傳媒被中共用金錢收買,結果中文資料的準確和水平低得十分之嚇人。至於台灣,畢竟其人口,以至擁有的資料,難以與中共控制的海量資料抗衡。儘管現時台灣政府,已經開始研發和投資自己的人工智慧大語言資料庫。 

問:如果現時中國當局的控制輿論手段不變,不論在ChatGPT,還是在其他生成式人工智慧平台,中文世界可能會很長一段時間處於劣勢,那要用ChatGPT豈不是一定要學好英文? 

李建軍:如果中國當局不改變現有政策,不給予中國人民言論和思想自由,縱使中國政府可以用各類古怪手法,繞過美國的制裁令,取得輝達(Nvidia)一類公司的頂級人工智慧晶片,都不會解決到中國在生成式人工智慧上的劣勢,最後中國當局只會用生成式人工智慧技術去製造假新聞、假歷史去維穩,但對提升中國人的生產水平,以至技術水平毫無幫助,因為中文的人工智慧系統學習的材料,只是一堆中宣部有意製造出來的假大空,在假大空為基礎上學習出來的東西,依然會是假大空,人工智慧並不會令一堆假大空的東西變得實在。 

隨西方國家在人工智慧發展上一日千里,如果日後中文在人工智慧發展上缺席的話,中共的封鎖資訊,以及打壓言論自由的作為,必須要負上最大責任,而非美國以及西方盟國政府為了維護自由社會的安全,針對中共作出的晶片封鎖。因為,中國得到的人工智慧晶片,很大機會並非用於民間提升生產力,而是用於協助軍方提升武器的精準度,對日本、台灣、韓國等自由國家構成威脅,或者提升人臉辨識技術水平,最終用於監控中國人民之上,令中國人的自由進一步受到箝制,維吾爾人和香港人受更大的迫害。在極權社會,一切技術都只會為政權而服務,而不會理會民間企業會否在新技術上得益,或者能改善人民生活。

新增評論

請將評論填寫在如下表格中。 評論必須符合自由亞洲電台的 《使用條款》並經管理員通過後方能顯示。因此,評論將不會在您提交後即時出現。自由亞洲電台對網友評論的內容不負任何責任。敬請各位尊重他人觀點並嚴守事實。