當前位置：首頁 >資訊 >版權資訊 >數(shù)據(jù)投喂大模型訓練 AI時代如何劃定版權邊界

數(shù)據(jù)投喂大模型訓練 AI時代如何劃定版權邊界

文章來源：cakjr8869 我要投稿

AI大模型時代，隨著AI生成內(nèi)容作品的數(shù)量不斷增多，這其中存在的版權問題顯得愈發(fā)引人注目，用人類的作品喂給 AI進行訓練之后生成的作品，算借鑒還是算抄襲？如果AI訓練必須執(zhí)行嚴格的版權規(guī)定，那么AI大模型在訓練過程中學習過一萬個人的作品，是否要經(jīng)過這1萬人一一授權？如果AI訓練不執(zhí)行版權保護，那么優(yōu)秀的原創(chuàng)作品是否經(jīng)過AI 二創(chuàng) 就會堂而皇之變成他人的作品？對于AI大模型訓練過程中所遭遇的版權問題，新京報貝殼財經(jīng)記者采訪了多位專家。聲音、圖像、文字作品成為大模型養(yǎng)料什么情況該維權？專家：看交易成本 8月26日，北京互聯(lián)網(wǎng)法院發(fā)布服務保障新質(zhì)生產(chǎn)力十大典型案例，其中包括殷某某訴某智能科技公司等人格權侵權案，該案也是全國首例 AI聲音侵權案。在該案中，一名配音演員的聲音在AI畫處理后，成為了文本轉(zhuǎn)語音產(chǎn)品，并被某科技公司運營的云服務平臺對外出售。而在此過程中，經(jīng)手配音演員聲音的除了該云服務平臺外，還有曾委托該演員錄制錄音制品的某文化傳媒公司，以及進行AI化處理的某軟件公司。最終，法院經(jīng)審理后判決，云服務平臺、軟件公司向原告書面賠禮道歉，文化傳媒公司、軟件公司賠償原告經(jīng)濟損失25萬元。雙方當事人均未提起上訴。不過，與該案中AI僅是從一名配音演員中提取聲音相比較，實際上大多數(shù)大模型用以訓練數(shù)據(jù)的聲源并不止一個。以音樂為例，AI音樂生成大模型SUNO或許從數(shù)據(jù)庫里學習了幾十億首曲子，如此多的音樂素材，如果均要事先獲得許可方能使用，交易成本是極其高昂的。對此，有技術從業(yè)者認為，若要過于強調(diào)AI訓練過程中數(shù)據(jù)來源的版權問題，可能AI技術根本就無法發(fā)展到當前階段。事實上，AI技術的進步反而促進了行業(yè)發(fā)展，如根據(jù)中國傳媒大學課題組發(fā)布《中國數(shù)字音樂平臺發(fā)展現(xiàn)狀與展望》報告，以AI為代表的科技創(chuàng)新在數(shù)字音樂產(chǎn)業(yè)的應用已日趨成熟，網(wǎng)易云音樂和小冰公司共同推出了AI音樂合成軟件 X Studio ，酷狗音樂推出了 AI音樂魔法和 AI音樂制作人，AI展現(xiàn)出了巨大的潛力和廣闊的發(fā)展前景。對于這一矛盾，在中央民族大學法學院副教授熊文聰在第二十四期E法數(shù)字音樂論壇上分享稱，對此，我國著作權法有合理使用的制度，合理使用有兩種類型：保障特定公益型合理使用，如閱讀障礙者使用已發(fā)表作品；交易成本過高型合理使用，如對設置或者陳列在公共場所的藝術作品進行臨摹、繪畫、攝影、錄像。交易成本取決于兩個要素，抓取、復制和收集的素材內(nèi)容數(shù)量特別大，甚至要到千萬量級。海量作品的版權人非常分散，沒有集中在個別主體手中，結果導致想要及時找到這些權利人一一簽訂許可使用協(xié)議的成本非常高。熊文聰說，例如，AI音樂生成所需要訓練的音樂素材假使要1000萬首音樂，這1000萬首音樂假如集中在一家音樂公司，前去交易的成本并不高，但如果有1000萬個版權人，每個人都去簽合同，交易成本就會變得非常高。熊文聰告訴貝殼財經(jīng)記者，在北京互聯(lián)網(wǎng)法院發(fā)布的案例中，AI只用了配音演員一個人的聲音，而不是從千萬個配音師的聲音中合成出一個誰也不像的聲音，交易成本并不高，事先找到配音師獲取許可也沒有問題，因此在這種情況下，就需要事先獲得授權。歐盟《人工智能法》的啟示：我國著作權制度有必要細化復制權的調(diào)整范圍今年3月13日，歐洲議會議員以523票贊成，46票反對，49票棄權批準了具有里程碑意義的《人工智能法》。《人工智能法》的出臺是為了確保在整個歐盟范圍內(nèi)提供一致和高水平的保護，實現(xiàn)可信賴人工智能系統(tǒng)的建立與應用，歐盟立法者希望通過統(tǒng)一的制度安排為歐盟市場創(chuàng)造統(tǒng)一、安定、高效的法治框架。在中央財經(jīng)大學副教授李陶看來，歐盟的《人工智能法》對我國著作權制度創(chuàng)新有所啟示，第一，從著作權保護規(guī)則看，我國的著作權制度有必要細化復制權的調(diào)整范圍，明確被允許使用的臨時復制的構成要件。當前，在全球范圍內(nèi)已經(jīng)出現(xiàn)了多個權利人依據(jù)復制權侵權維權的案件，如紐約時報在針對OpenAI的起訴書中認為，聊天機器人向用戶提供了《紐約時報》文章的近乎逐字摘錄，之所以OpenAI和Microsoft特別強調(diào)使用《紐約時報》新聞來訓練他們的人工智能程序，因為這些材料被認為是可靠和準確的。李陶對此建議，我國在《著作權實施條例》中對臨時復制行為進行必要的界定，以完成技術發(fā)展和立法目的之間的適配。具體在立法中需要嚴格界定臨時復制各個構成要件的內(nèi)涵，為權利人和作為使用者的人工智能模型提供者創(chuàng)造可預期的法律依據(jù)。熊文聰介紹，近年來歐盟、日本等國家或地區(qū)積極修訂著作權法，增設了多項作品使用的例外情形，立法通過明確文本和數(shù)據(jù)挖掘技術利用他人作品的行為屬于著作權的限制或例外，掃除AI發(fā)展過程中的法律障礙。其中，美國合理使用規(guī)則(特別是轉(zhuǎn)換性使用 )比較靈活。在他看來，我國《著作權法》第24條沒有列明文本和數(shù)據(jù)挖掘情形，且第(13)項法律、行政法規(guī)規(guī)定的其他情形是一個半封閉式的立法模式;在新《實施條例》尚未出臺之前，唯一可行的方案是將TDM解釋為第(2)項:為介紹、評論某一作品或者說明某一問題，在作品中適當引用他人已經(jīng)發(fā)表的作品。李陶表示，我國《著作權法》有必要增添有關保障通用人工智能模型提供者開展人工智能訓練的合理使用和法定許可規(guī)則，歐盟《人工智能法》明確了通用人工智能模型的提供者可以使用開源的著作權保護客體以及在歐盟文本和數(shù)據(jù)挖掘例外制度的適用下進行系統(tǒng)的開發(fā)和訓練。我國應當盡快通過《著作權法》修訂增添有關文本和數(shù)據(jù)挖掘的合理使用制度，以便讓相關主體（特別是以科學研究為目的的主體）能夠享受到技術帶來的開發(fā)利用著作權法保護客體的便利。但通過概念擴張完全免除以營利為目的相關主體的付費義務，會背離文本和數(shù)據(jù)挖掘原本產(chǎn)生的立法意圖。因此，也可以在引入有關文本和數(shù)據(jù)挖掘合理使用規(guī)則的同時，考慮引入新的法定許可機制，以求保障創(chuàng)作者能夠針對人工智能系統(tǒng)對其著作權法保護客體的開發(fā)與利用獲得適當合理的報酬。李陶說。數(shù)據(jù)投喂大模型訓練 AI時代如何劃定版權邊界

## 數(shù)據(jù)投喂大模型訓練 AI 時代如何劃定版權邊界隨著人工智能技術的飛速發(fā)展，大語言模型的訓練需要大量的文本數(shù)據(jù)。這些數(shù)據(jù)的來源廣泛，包括互聯(lián)網(wǎng)、書籍、報紙、雜志、論文等。在這個過程中，涉及到了版權的問題。一方面，模型訓練需要使用大量的文本數(shù)據(jù)，這些數(shù)據(jù)的版權歸屬并不明確。如果模型訓練公司直接使用這些數(shù)據(jù)進行訓練，可能會侵犯原作者的版權。另一方面，模型訓練公司在訓練完成后，可能會將模型輸出的文本用于商業(yè)用途，如生成廣告文案、新聞報道等。如果這些文本涉及到原作者的版權，那么模型訓練公司就需要獲得原作者的授權或許可，否則就會侵犯原作者的版權。為了解決這個問題，一些國家和地區(qū)已經(jīng)開始采取措施，加強對數(shù)據(jù)投喂大模型訓練的版權保護。例如，歐盟在 2018 年通過了《版權指令》，要求在線平臺對用戶上傳的內(nèi)容進行版權審查，以避免侵犯版權。美國也在考慮通過立法來加強對數(shù)據(jù)投喂大模型訓練的版權保護。除了加強版權保護之外，還需要建立合理的數(shù)據(jù)使用機制，以平衡版權所有者和模型訓練公司的利益。例如，可以建立數(shù)據(jù)共享平臺，讓版權所有者和模型訓練公司可以在平臺上進行數(shù)據(jù)交易，以實現(xiàn)數(shù)據(jù)的最大化利用。同時，也可以建立數(shù)據(jù)信托機構，負責管理和分發(fā)數(shù)據(jù)，以保護版權所有者的利益。此外，還需要加強對人工智能技術的監(jiān)管，確保模型訓練公司遵守相關法律法規(guī)，尊重版權所有者的權益。監(jiān)管機構可以通過制定相關標準和指南，規(guī)范模型訓練公司的數(shù)據(jù)使用行為，防止侵權行為的發(fā)生。總之，數(shù)據(jù)投喂大模型訓練是人工智能發(fā)展的重要環(huán)節(jié)，但是需要在保護版權的前提下進行。我們需要加強版權保護、建立合理的數(shù)據(jù)使用機制、加強對人工智能技術的監(jiān)管，以確保人工智能技術的健康發(fā)展。

官方微博：@全影網(wǎng) https://weibo.com/7192com

官方微信：想在手機上獲取最新鮮資訊嗎？添加全影網(wǎng)官方微信：www7192com

上一篇：荊州警方打掉一印刷銷售盜版教輔犯罪團伙

下一篇：焦和平:如何合理計算著作權懲罰性賠償數(shù)額？

免責聲明：

本站部分內(nèi)容、觀點、圖片、文字、視頻來自網(wǎng)絡，僅供大家學習和交流，真實性、完整性、及時性本站不作任何保證或承諾。如果本站有涉及侵犯您的版權、著作權、肖像權的內(nèi)容，請聯(lián)系我們(0536-8337192),我們會立即審核并處理。