當前位置:首頁 >資訊 >版權資訊 >數(shù)據(jù)投喂大模型訓練 AI時代如何劃定版權邊界

數(shù)據(jù)投喂大模型訓練 AI時代如何劃定版權邊界

文章來源:cakjr8869   我要投稿  
AI大模型時代,隨著AI生成內(nèi)容作品的數(shù)量不斷增多,這其中存在的版權問題顯得愈發(fā)引人注目,用人類的作品 喂給 AI進行訓練之后生成的作品,算 借鑒 還是算 抄襲 ?如果AI訓練必須執(zhí)行嚴格的版權規(guī)定,那么AI大模型在訓練過程中學習過一萬個人的作品,是否要經(jīng)過這1萬人一一授權?如果AI訓練不執(zhí)行版權保護,那么優(yōu)秀的原創(chuàng)作品是否經(jīng)過AI 二創(chuàng) 就會堂而皇之變成他人的作品? 對于AI大模型訓練過程中所遭遇的版權問題,新京報貝殼財經(jīng)記者采訪了多位專家。 聲音、圖像、文字作品成為大模型 養(yǎng)料 什么情況該維權? 專家:看交易成本 8月26日,北京互聯(lián)網(wǎng)法院發(fā)布服務保障新質(zhì)生產(chǎn)力十大典型案例,其中包括殷某某訴某智能科技公司等人格權侵權案,該案也是全國首例 AI聲音侵權案 。 在該案中,一名配音演員的聲音在AI畫處理后,成為了文本轉(zhuǎn)語音產(chǎn)品,并被某科技公司運營的云服務平臺對外出售。而在此過程中, 經(jīng)手 配音演員聲音的除了該云服務平臺外,還有曾委托該演員錄制錄音制品的某文化傳媒公司,以及進行AI化處理的某軟件公司。最終,法院經(jīng)審理后判決,云服務平臺、軟件公司向原告書面賠禮道歉,文化傳媒公司、軟件公司賠償原告經(jīng)濟損失25萬元。雙方當事人均未提起上訴。 不過,與該案中AI僅是從一名配音演員中提取聲音相比較,實際上大多數(shù)大模型用以訓練數(shù)據(jù)的聲源并不止一個。以音樂為例,AI音樂生成大模型SUNO或許從數(shù)據(jù)庫里學習了幾十億首曲子,如此多的音樂素材,如果均要事先獲得許可方能使用,交易成本是極其高昂的。 對此,有技術從業(yè)者認為,若要過于強調(diào)AI訓練過程中數(shù)據(jù)來源的版權問題,可能AI技術根本就無法發(fā)展到當前階段。事實上,AI技術的進步反而促進了行業(yè)發(fā)展,如根據(jù)中國傳媒大學課題組發(fā)布《中國數(shù)字音樂平臺發(fā)展現(xiàn)狀與展望》報告,以AI為代表的科技創(chuàng)新在數(shù)字音樂產(chǎn)業(yè)的應用已日趨成熟,網(wǎng)易云音樂和小冰公司共同推出了AI音樂合成軟件 X Studio ,酷狗音樂推出了 AI音樂魔法 和 AI音樂制作人 ,AI展現(xiàn)出了巨大的潛力和廣闊的發(fā)展前景。 對于這一矛盾,在中央民族大學法學院副教授熊文聰在第二十四期E法數(shù)字音樂論壇上分享稱,對此,我國著作權法有 合理使用 的制度,合理使用有兩種類型: 保障特定公益 型合理使用,如閱讀障礙者使用已發(fā)表作品; 交易成本過高 型合理使用,如對設置或者陳列在公共場所的藝術作品進行臨摹、繪畫、攝影、錄像。 交易成本取決于兩個要素,抓取、復制和收集的素材內(nèi)容數(shù)量特別大,甚至要到千萬量級。海量作品的版權人非常分散,沒有集中在個別主體手中,結果導致想要及時找到這些權利人一一簽訂許可使用協(xié)議的成本非常高。 熊文聰說, 例如,AI音樂生成所需要訓練的音樂素材假使要1000萬首音樂,這1000萬首音樂假如集中在一家音樂公司,前去交易的成本并不高,但如果有1000萬個版權人,每個人都去簽合同,交易成本就會變得非常高。 熊文聰告訴貝殼財經(jīng)記者,在北京互聯(lián)網(wǎng)法院發(fā)布的案例中,AI只用了配音演員一個人的聲音,而不是從千萬個配音師的聲音中合成出一個 誰也不像 的聲音,交易成本并不高,事先找到配音師獲取許可也沒有問題,因此在這種情況下,就需要事先獲得授權。 歐盟《人工智能法》的啟示: 我國著作權制度有必要細化復制權的調(diào)整范圍 今年3月13日,歐洲議會議員以523票贊成,46票反對,49票棄權批準了具有里程碑意義的《人工智能法》。 《人工智能法》的出臺是為了確保在整個歐盟范圍內(nèi)提供一致和高水平的保護,實現(xiàn)可信賴人工智能系統(tǒng)的建立與應用,歐盟立法者希望通過統(tǒng)一的制度安排為歐盟市場創(chuàng)造統(tǒng)一、安定、高效的法治框架。 在中央財經(jīng)大學副教授李陶看來,歐盟的《人工智能法》對我國著作權制度創(chuàng)新有所啟示,第一,從著作權保護規(guī)則看,我國的著作權制度有必要細化復制權的調(diào)整范圍,明確被允許使用的 臨時復制 的構成要件。 當前,在全球范圍內(nèi)已經(jīng)出現(xiàn)了多個權利人依據(jù)復制權侵權維權的案件,如紐約時報在針對OpenAI的起訴書中認為,聊天機器人向用戶提供了《紐約時報》文章的近乎逐字摘錄,之所以OpenAI和Microsoft特別強調(diào)使用《紐約時報》新聞來訓練他們的人工智能程序,因為這些材料被認為是可靠和準確的。 李陶對此建議,我國在《著作權實施條例》中對臨時復制行為進行必要的界定,以完成技術發(fā)展和立法目的之間的適配。具體在立法中需要嚴格界定臨時復制各個構成要件的內(nèi)涵,為權利人和作為使用者的人工智能模型提供者創(chuàng)造可預期的法律依據(jù)。 熊文聰介紹,近年來歐盟、日本等國家或地區(qū)積極修訂著作權法,增設了多項作品使用的例外情形,立法通過明確文本和數(shù)據(jù)挖掘技術利用他人作品的行為屬于著作權的限制或例外,掃除AI發(fā)展過程中的法律障礙。其中,美國 合理使用 規(guī)則(特別是 轉(zhuǎn)換性使用 )比較靈活。 在他看來,我國《著作權法》第24條沒有列明文本和數(shù)據(jù)挖掘情形,且第(13)項 法律、行政法規(guī)規(guī)定的其他情形 是一個半封閉式的立法模式;在新《實施條例》尚未出臺之前,唯一可行的方案是將TDM解釋為第(2)項:為介紹、評論某一作品或者說明某一問題,在作品中適當引用他人已經(jīng)發(fā)表的作品。 李陶表示,我國《著作權法》有必要增添有關保障通用人工智能模型提供者開展人工智能訓練的合理使用和法定許可規(guī)則, 歐盟《人工智能法》明確了通用人工智能模型的提供者可以使用開源的著作權保護客體以及在歐盟文本和數(shù)據(jù)挖掘例外制度的適用下進行系統(tǒng)的開發(fā)和訓練。我國應當盡快通過《著作權法》修訂增添有關文本和數(shù)據(jù)挖掘的合理使用制度,以便讓相關主體(特別是以科學研究為目的的主體)能夠享受到技術帶來的開發(fā)利用著作權法保護客體的便利。 但通過概念擴張完全免除以營利為目的相關主體的付費義務,會背離文本和數(shù)據(jù)挖掘原本產(chǎn)生的立法意圖。因此,也可以在引入有關文本和數(shù)據(jù)挖掘合理使用規(guī)則的同時,考慮引入新的法定許可機制,以求保障創(chuàng)作者能夠針對人工智能系統(tǒng)對其著作權法保護客體的開發(fā)與利用獲得適當合理的報酬。 李陶說。數(shù)據(jù)投喂大模型訓練 AI時代如何劃定版權邊界
## 數(shù)據(jù)投喂大模型訓練 AI 時代如何劃定版權邊界 隨著人工智能技術的飛速發(fā)展,大語言模型的訓練需要大量的文本數(shù)據(jù)。這些數(shù)據(jù)的來源廣泛,包括互聯(lián)網(wǎng)、書籍、報紙、雜志、論文等。在這個過程中,涉及到了版權的問題。 一方面,模型訓練需要使用大量的文本數(shù)據(jù),這些數(shù)據(jù)的版權歸屬并不明確。如果模型訓練公司直接使用這些數(shù)據(jù)進行訓練,可能會侵犯原作者的版權。另一方面,模型訓練公司在訓練完成后,可能會將模型輸出的文本用于商業(yè)用途,如生成廣告文案、新聞報道等。如果這些文本涉及到原作者的版權,那么模型訓練公司就需要獲得原作者的授權或許可,否則就會侵犯原作者的版權。 為了解決這個問題,一些國家和地區(qū)已經(jīng)開始采取措施,加強對數(shù)據(jù)投喂大模型訓練的版權保護。例如,歐盟在 2018 年通過了《版權指令》,要求在線平臺對用戶上傳的內(nèi)容進行版權審查,以避免侵犯版權。美國也在考慮通過立法來加強對數(shù)據(jù)投喂大模型訓練的版權保護。 除了加強版權保護之外,還需要建立合理的數(shù)據(jù)使用機制,以平衡版權所有者和模型訓練公司的利益。例如,可以建立數(shù)據(jù)共享平臺,讓版權所有者和模型訓練公司可以在平臺上進行數(shù)據(jù)交易,以實現(xiàn)數(shù)據(jù)的最大化利用。同時,也可以建立數(shù)據(jù)信托機構,負責管理和分發(fā)數(shù)據(jù),以保護版權所有者的利益。 此外,還需要加強對人工智能技術的監(jiān)管,確保模型訓練公司遵守相關法律法規(guī),尊重版權所有者的權益。監(jiān)管機構可以通過制定相關標準和指南,規(guī)范模型訓練公司的數(shù)據(jù)使用行為,防止侵權行為的發(fā)生。 總之,數(shù)據(jù)投喂大模型訓練是人工智能發(fā)展的重要環(huán)節(jié),但是需要在保護版權的前提下進行。我們需要加強版權保護、建立合理的數(shù)據(jù)使用機制、加強對人工智能技術的監(jiān)管,以確保人工智能技術的健康發(fā)展。

官方微博:@全影網(wǎng) https://weibo.com/7192com

官方微信:想在手機上獲取最新鮮資訊嗎?添加全影網(wǎng)官方微信:www7192com

免責聲明:

本站部分內(nèi)容、觀點、圖片、文字、視頻來自網(wǎng)絡,僅供大家學習和交流,真實性、完整性、及時性本站不作任何保證或承諾。如果本站有涉及侵犯您的版權、著作權、肖像權的內(nèi)容,請聯(lián)系我們(0536-8337192),我們會立即審核并處理。

我要評論

當前已有loading...個參與
驗證碼: 驗證碼,看不清楚?請點擊刷新驗證碼

名企招聘

人才求職

婚紗攝影

人才網(wǎng)X 關閉

掃描訪問手機版