彭博社、《紐約時報》等知名媒體正在阻止OpenAI、其他相關AI資料庫的網路爬蟲訪問自家網站,避免內容遭到抓取和保存,並用以訓練大型語言模型(LLM)。這可能是一場完全不平等的抗爭。對於GPT-4這類生成式AI模型而言,吸收精準資訊和流暢文筆十分重要,然而網路爬蟲每每繞過付費牆直接挖寶,帶回大量受到版權保護的訓練素材,嚴重侵害媒體公司的智慧財產。
資料來源:technews.tw/2023/12/22/how-publishers-blocking-ai-web-crawlers/
責任編輯:林薇晨(政治大學 傳播碩士學位學程 碩士)