TCS 臺灣傳播調查資料庫

【產業動態】AI公司用網路爬蟲挖資料餵養LLM，而被「挖」的媒體正在醞釀一場不對等的抗爭

日期

2023-12-22

新聞來源

科技新報

內容

彭博社、《紐約時報》等知名媒體正在阻止OpenAI、其他相關AI資料庫的網路爬蟲訪問自家網站，避免內容遭到抓取和保存，並用以訓練大型語言模型（LLM）。這可能是一場完全不平等的抗爭。對於GPT-4這類生成式AI模型而言，吸收精準資訊和流暢文筆十分重要，然而網路爬蟲每每繞過付費牆直接挖寶，帶回大量受到版權保護的訓練素材，嚴重侵害媒體公司的智慧財產。

資料來源：technews.tw/2023/12/22/how-publishers-blocking-ai-web-crawlers/

責任編輯：林薇晨（政治大學傳播碩士學位學程碩士）

關鍵字

OpenAI、GPT-4、大型語言模型、付費牆、版權、網路爬蟲

產業新聞

【產業動態】AI公司用網路爬蟲挖資料餵養LLM，而被「挖」的媒體正在醞釀一場不對等的抗爭