圖:香港大學舉辦人工智能教育博覽,提高社會對人工智能技術和素養(yǎng)的認識。
使用數(shù)據(jù)訓練AI大模型,有潛在侵權風險,特別是當訓練數(shù)據(jù)涉及受版權保護的內(nèi)容、個人信息或受限制的商業(yè)數(shù)據(jù)。2023年,美國紐約時報起訴OpenAI與微軟,指控ChatGPT在未經(jīng)授權的情況下覆製其文章內(nèi)容用于訓練,且生成的回答可逐字復現(xiàn)原文段落,侵犯版權。爭議焦點在于,模型輸出是否構成“演繹作品”,以及訓練階段的臨時數(shù)據(jù)覆製是否適用“合理使用”。簡單來說,該案涉及“數(shù)據(jù)價值分配權”,判決結果將重塑AI行業(yè)的數(shù)據(jù)獲取成本與創(chuàng)新速度。隨著數(shù)據(jù)抓取時代邁步“合規(guī)化”,授權數(shù)據(jù)生態(tài)逐步的建立,對推動AI創(chuàng)新具有重大意義。