產業新聞


【產業動態】AI公司用網路爬蟲挖資料餵養LLM,而被「挖」的媒體正在醞釀一場不對等的抗爭

日期
2023-12-22
新聞來源
科技新報
內容

彭博社、《紐約時報》等知名媒體正在阻止OpenAI、其他相關AI資料庫的網路爬蟲訪問自家網站,避免內容遭到抓取和保存,並用以訓練大型語言模型(LLM)。這可能是一場完全不平等的抗爭。對於GPT-4這類生成式AI模型而言,吸收精準資訊和流暢文筆十分重要,然而網路爬蟲每每繞過付費牆直接挖寶,帶回大量受到版權保護的訓練素材,嚴重侵害媒體公司的智慧財產。

 

資料來源:technews.tw/2023/12/22/how-publishers-blocking-ai-web-crawlers/

責任編輯:林薇晨(政治大學 傳播碩士學位學程 碩士)
 

關鍵字
OpenAI、GPT-4、大型語言模型、付費牆、版權、網路爬蟲