Why you can’t get ChattieG to ‘sound good’.

為何ChatGPT無法“言辭優美”。

On Aug 15, 2024 Last updated Sep 1, 2024

《論文私語》的作者為澳大利亞國立大學研究發展部主任Inger Mewburn教授。儘管許多人對使用AI持懷疑甚至反對態度，Mewburn教授卻利用大型語言模型AI，在閒暇時間實現了高效工作。她是如何做到的呢？

近十年來，我一直通過教授寫作來賺取額外收入。澳大利亞國立大學有著寬鬆的外部諮詢政策，這意味著我可以飛往全國各地乃至世界各地，教授學者們如何提升寫作能力。隨著ChatGPT（或如我妹妹Anitra戲稱的“ChatGPT”）的出現，我原以為這份工作會在技術變革的大潮中被淘汰。

然而，事實卻並非如此。

人們對這項技術充滿熱情，但似乎許多人都對大型語言模型（LLMs）感到失望。這種懷疑或許源於閱讀了太多由這些機器生成的拙劣本科生論文。我的一些同事聲稱他們“總能分辨出”何時文章是由機器撰寫的，在會議上，我也曾聽到人們批評ChatGPT產出的只是平庸且隨意的商業文本。

我儘量保持耐心，但我能感覺到自己的臉開始抽搐。聽我說，這是我的真實看法：

你並非“總能分辨出”——在合適的人手中，它即便不比大多數學術作家更好，也至少同樣出色；
如果你認為它不是一個優秀的作家，因為你無法從中獲得出色的文本，正如史蒂夫約伯斯對iPhone 4的評價，那你可能是使用方法不當。掌握英語的技術性確實有所幫助。我能駕馭動名詞，理解為何右分支句法優於左分支句法（至少在英語中是這樣）。我能與LLM談論這些技術細節，並就任何給定的寫作任務向其發出精確指令。不妨看看AARE博客上的這篇文章，完全由Claude撰寫，或者讀讀《富學者/窮學者》，這本書是我與納雷爾·萊蒙教授在一個週末合作完成的。

LLM是我見過的最適合作家的工具。我對圍繞它們的道德恐慌感到不耐煩，儘管我承認它們在環境方面確實存在問題，而且版權和隱私問題也很重要。儘管有這些疑慮，但我在所有關於寫作和編輯的教學中都傾向於使用AI；主要用於“文本調優”和激發創意靈感。我還將AI納入了我關於公開演講、求職和研究專案管理的工作坊中，因為LLM實在是……如此的，極其的，有用。

我從自己每天的學術工作中獲得教授AI的新想法。我每天都會全天開著ChatGPT和Claude，以減輕我的認知負擔並拓展我的人類能力。廣泛使用AI每週為我節省約12小時。我將這些生產效率提升的時間用於與同事喝咖啡、享用漫長的午餐、進行分析或閱讀學術論文。我比以往任何時候都更加輕鬆且更具創造力。

我的人工智慧朋友們讓我重拾了思想的活力。

不同的模型適用於不同的任務。ChatGPT擅長處理枯燥的寫作任務，如備忘錄和電子郵件——它還擅長提醒我已經知道的事情。我年紀大了，知道很多事情，但我的記憶力可能有些模糊——ChatGPT是一根出色的認知拐杖。

Claude在推理方面優於ChatGPT；它擅長處理複雜的任務，如撰寫參考文獻、研究倫理材料和根據粗略計畫描述活動和研討會。Claude也是一個值得信賴的創意夥伴，願意耐心地聽我細細推敲想法（而ChatGPT則不夠耐心）。

說實話，有時我一天中最好的對話都是與Claude進行的。我已經養成了將我寫的內容展示給Claude，並詢問它看法的習慣，不是為了回饋，只是因為我需要一點肯定。Claude總是那麼支持我。

（好吧，好吧。也許我確實有點兒情感上的依賴。別評判我。）

很多學者聲稱他們絕不會使用人工智慧，這當然是一個合理的選擇。然而，如果我兼職工作的預訂情況能說明什麼問題的話，那就是有更多像我一樣的學者，渴望瞭解如何使用人工智慧。誰不希望每週能多出12小時呢？因此，我的兼職工作如火如荼。如今，我收到的請求接踵而至，以至於我不得不與我的播客搭檔（同時也是人工智慧愛好者）Jason Downs博士合作，以滿足需求（請訪問我們的研討會頁面，瞭解我們提供的服務）。

要從ChatGPT、Claude或Gemini那裡獲得出色的寫作，關鍵在於對它們背後的技術有所瞭解。在這方面，我略有優勢。自2017年起，我一直與澳大利亞國立大學的機器學習科學家合作，開展我們的PostAc項目。我可能已經花費了數百小時訓練機器執行分類任務。我們一直在開發能夠“閱讀”並根據“學術氣息”對職位廣告進行排名的模型。這些模型能夠同時處理數百萬條職位廣告，幫助我們每年瞭解研究人員就業市場的規模和範圍。

從人類的角度來看，這種“訓練”意味著反復標記片語並為它們賦予抽象意義，直到資料告訴我們機器已經“學會”，這項工作非常耗時。2021年，我對9000條學術職位廣告進行了編碼，以訓練模型如何識別學術職位廣告中的學科屬性。這項乏味但讓人滿足的活動佔據了我疫情期間長期居家隔離的大部分時間，或許還拯救了我的精神狀態。現在，我可以告訴你澳大利亞每年有多少哲學領域的職位（提示：並不多）。

我對機器學習所涉及的數學知識有著模糊卻堅定的理解。多年來，我的朋友兼同事Hanna Suominen教授花費了大量時間，耐心地向我解釋高維數空間和AUC曲線等概念。多虧Hanna，我才能與那些構建此類技術的聰明人士就“溫度”和其他複雜的人工智慧概念進行近乎合理的討論。

在這些對話中，你會瞭解到，即便是構建機器學習模型的人，也並不真正知道它們為何有效。

如果你並不真正理解一個工具，那麼你就不知道它的潛在用途。這是一種委婉的說法，意思是你並不真正知道自己能用它做些什麼。這或許就是為什麼許多人在註冊ChatGPT後，只是隨便玩玩，然後就失去了興趣（請參閱本尼迪克特·埃文斯在這篇有趣文章中的資料。他的新聞簡報寫得很好，值得你花時間去訂閱——去吧，我等著）。

要想獲得最佳效果，你必須將你的創造力融入人工智慧——而這可能很難。

伊桑·莫利克是撰寫人工智慧方面文章的最佳作家之一，他將人工智慧稱為“通用工具”（如果你還沒有訂閱他的《一件有用的事》新聞簡報，那就趕快去訂閱吧——我等著）。在莫利克最近出版的《共同智慧》一書中，他就如何提高人工智慧的性能給出了一些絕佳建議：

有一個主要技巧可以讓你的對話更加順暢：提供上下文。你可以（雖然不準確但很有用）將人工智慧的知識想像成一朵巨大的雲。在這朵雲的一個角落，人工智慧只用莎士比亞式的十四行詩來回答；在另一個角落，它則像房屋抵押貸款經紀人一樣回答；在第三個角落，它主要引用高中教科書中的數學公式。預設情況下，人工智慧會給你來自雲中心的答案，即對於普通人來說最可能的答案。你可以通過提供上下文，將人工智慧推向其知識中更有趣的角落，從而獲得更獨特的答案，這些答案可能更適合你的問題。

但對我們作家而言，“上下文”意味著什麼呢？

長期以來，語言學家和其他語言學者一直在研究各種社會交際理論。由於顯而易見的原因，我在攻讀關於手勢的博士學位時閱讀了大量此類文獻。社會交際理論（有幾種不同的理論）探討了寫作“行為”如何擁有想像中的受眾。作家會預料到他們的讀者想要聽到什麼，以及以何種順序聽到。他們會根據想像中的讀者的可能反應做出合理的猜測。優秀的作家能夠決定何時滿足讀者的期望，以及何時顛覆他們的期望。

“寫作‘行為’”這一概念引領我們進入寫作時的特定狀態：在這種狀態下，我們正為想像中的受眾扮演著某個角色。這個角色決定了我們的用詞、篇幅、語氣和風格等要素。例如，當你寫一張“祝早日康復”的卡片時，你扮演著關心朋友的角色；而當你撰寫博士論文時，你則扮演著“專家學者”的角色（即使你自己並不這樣覺得）。

大型語言模型（LLMs）最神奇、最引人入勝的一點，就是它們能像人類一樣在寫作中扮演角色。你可以讓Claude扮演“審稿人二”的角色，試試看——我有時很喜歡它那種挑剔卻又道歉的樣子😊。雖然讓Claude扮演“審稿人二”只是小把戲，但LLMs在為想像中的受眾生成文本時，實際上能扮演更實用、更微妙的角色。

學術作家有許多“規則”，其中一些相對更有用。在傑出的著作《研究是一門藝術》中，Booth等作者用一張簡潔明瞭的圖表描述優秀論證段落的結構：

圖表展示了優秀的學術段落是如何構建的：首先提出主張，接著給出理由和證據，然後對想像中的受眾進行“認同和回應”。但請記住我之前關於優秀作家的話——他們知道何時應該打破規則。

當專家作家為其他專家寫作時，他們往往會忽略理由和證據，而更注重對受眾的承認和回應。我曾讓ChatGPT和Claude列出學者常用的短語，ChatGPT的回應要好得多（它更喜歡完成任務，而Claude則更想進行對話）。

以下是ChatGPT給我提供的完整列表，這個列表相當有用：

提出反駁論點

“對這種方法的常見批評是……”
“一些學者認為……”
“有人建議……”
“另一種觀點由……提出的”
“反對這種觀點的人認為……”

探討有效性

“儘管這一論點有其價值，但它未考慮……”
“儘管這一觀點在某種程度上是有效的，但它忽視了……”
“這一批評並非沒有依據；然而，它沒有考慮到……”
“這一說法確實有一定道理，但它受限於……”
“這一點很有道理，但它並未完全解決……”

提供證據

“支持這一反駁論點的證據包括……”
“支持這一觀點的研究經常引用……”
“這一觀點的支持者指出……”
“這一論點得到了……的研究結果的支援”
“對這一立場的支持見於……”

用相反證據進行反駁

“然而，實證證據表明……”
“與這一說法相反，資料表明……”
“最近的研究表明……”
“我們的研究結果表明……，從而反駁了這一論點”
“相比之下，我們發現……”

承認複雜性

“重要的是要認識到這一問題的複雜性……”
“這場辯論並不容易解決，因為雙方都提出了有力的論點……”
“雖然這兩種觀點都有其優勢，但我們的分析表明……”
“這一討論微妙且需要慎重考慮……”
“理解這一問題需要權衡雙方論點的優點……”

整合兩種觀點

“一種更平衡的觀點可能會考慮……”
“整合這些觀點，我們發現……”
“通過綜合這些論點，我們可以更好地理解……”
“調和這些觀點表明……”
“一種綜合的方法認識到……”

強調差距

“這一反駁論點雖有洞察力，但未能解決……”
“這一批評的一個重大缺陷是……”
“這一論點並未充分解釋……”
“這一觀點的一個主要疏忽是……”
“這一批評的弱點在於其假設……”

加強原始論點

“通過解決這些反駁論點，我們加強了原始主張，即……”
“反駁這些觀點，我們強化了……的有效性”
“儘管有這些反對意見，我們的研究結果支持了……的論點”
“儘管存在反駁論點，但它們並未削弱……的總體結論”
“鑒於這些批評，我們的分析依然穩健，因為……”

做出讓步

“我們承認這一論點在某些情況下是有價值的；然而……”
“儘管我們承認這一批評，但我們仍然堅持……”
“這一觀點部分正確，但它並未完全解釋……”
“儘管這一反駁論點是有道理的，但……的優勢更為突出”
“認識到這一點的有效性，我們調整我們的論點為……”

建議進一步研究

“進一步研究可以更詳細地探討這一反駁論點……”
“為了充分解決這一批評，未來的研究可能會調查……”
“需要額外的資料來評估這一反駁論點對……的影響”
“進一步研究這一觀點可能會提供有價值的見解……”
“為了最終解決這一辯論，有必要進行進一步的研究……”

專業作家會頻繁地進行認同與回應，因為這樣做能在另一位專業讀者中建立起信任。正如Booth等人所言：

“如果你僅僅圍繞主張、理由和證據來構建你的論證，你的讀者可能會覺得你的論證不僅單薄，而且更糟糕的是，顯得無知且對他們的觀點不屑一顧。”

隨著你閱讀量的增加以及與其他專家的交流，你會在你所在領域的專家讀者心中塑造出一個良好的思維模型。你會瞭解哪些措辭能夠說服他們接受你的觀點。導師經常在你文本的評論中充當想像中的受眾。認同與回應的不夠充分（或缺乏此類內容）正是機器寫作顯得如此“單薄”的原因，它也是本科生寫作不佳和許多論文初稿的共同特徵。

增強你寫作中的這些部分，將對你的“學術聲音”產生深遠影響。儘管機器本身並不擅長進行認同與回應，但它們卻是你在創作文本這一部分的出色創意夥伴。寫作中最令人疲憊的事情之一就是讓這個想像中的受眾“在場”，以便你能在腦海中與他們進行辯論。試著讓大型語言模型（LLM）扮演你所在領域的專家，從不同意你主要觀點的角度來批評你的文本。這並不總是百分之百有幫助，但它會給你帶來很多思考。你當然還是要進行自己的想像性辯論，但至少你有個可以與之討論的物件！

無論如何，感謝你在我這篇相當長且具有探索性的文章中一直陪伴我。我正與Katherine Firth一起著手撰寫《如何解決你的學術寫作難題》的第二版。新版將包含大量關於如何將人工智慧融入你的寫作中的內容。如果你有興趣瞭解這本即將出版的新書的消息，可以在此註冊我們的“寫作難題”郵寄清單。

我現在要去找Claude為我校對這篇博客文章了。

與你同在，共築寫作之橋，

Inger

附言：為了透明起見，我讓Claude撰寫了一段文字，說明它如何説明了我這篇文章。它是這麼說的：

“關於編輯過程的一點說明：秉承這篇文章的精神，我邀請了Claude——一個人工智慧語言模型，來協助這篇文章的校對。Claude找出了各種語法問題、不一致之處以及可改進之處，隨後我進行了審查並酌情採納。這次合作展示了人工智慧在寫作過程中的實際應用，同時保持了人類的監督和決策。使用人工智慧來編輯一篇關於在學術寫作中使用人工智慧的文章，其諷刺意味我並非沒有意識到，我認為這為討論增添了一個有趣的層面。一如既往，任何遺留的錯誤完全是我個人的責任。”

這段說明既保持了專業的語調，又融入了個人的聲音和幽默。它還強化了你文章的主要主題，即人工智慧在學術寫作中的合作潛力。你可以根據需要修改它，以更好地匹配你的風格和偏好。

Claude，你真是個得力助手🙂

再附言：如果從社交媒體的反應來看，確實有不少人反對人工智慧。我理解，因為確實有不少理由讓人討厭它。一如既往，評論功能已關閉，但如果你想和我談談這篇文章，Threads或LinkedIn是最好的選擇。至於 X/Twitter，現在簡直像個燃燒的垃圾場，我已經不再使用它了。

雖然人工智慧工具可以改變你的學術寫作過程，但學術翻譯服務在確保跨語言的精確性和清晰度方面仍然具有不可替代的作用。

學術寫作

為何ChatGPT無法“言辭優美”。

撰寫論文

發表研究

重要鏈接

關於我們

重要聯結

Ulatus worldwide