產業新聞


【產業動態】尋求新資料訓練 GPT-4 惹議,OpenAI 轉錄百萬小時 YouTube 影片

日期
2024-04-09
新聞來源
科技新報
內容

AI 科技公司目前迫切需要新資料來訓練模型,使用這些資料是否涉及版權灰色地帶則尚有待商榷。外媒報導,OpenAI已透過自家開發的 Whisper 模型轉錄超過 100 萬小時的 YouTube 影片來訓練 GTP-4,其實早在 2021 年 OpenAI就已用盡訓練資料,並開始將目光轉向影片、Podcast 等內容。雖然 Google 發言人提到,服務條款中有禁止未經授權的下載 YouTube 內容,但如今大型公司如 Google、OpenAI、Meta 都試圖以最方便的途徑取得資料,引發業者、創作者提出侵權訴訟。


資料來源:technews.tw/2024/04/08/openai-transcribed-over-1m-hours-of-youtube-videos-and-used-the-text-to-train-gpt-4/
責任編輯:沈思妤(就讀於:政治大學 傳播碩士學位學程)
 

關鍵字
AI 科技公司、OpenAI、ChatGPT、GPT-4、Whisper