當(dāng)前位置:首頁(yè) >資訊 >版權(quán)資訊 >版權(quán)前沿|明確人工智能數(shù)據(jù)訓(xùn)練的版權(quán)邊界

版權(quán)前沿|明確人工智能數(shù)據(jù)訓(xùn)練的版權(quán)邊界

文章來(lái)源:良瀠坤   我要投稿  
編者按  在生成式人工智能數(shù)據(jù)訓(xùn)練過(guò)程中,未經(jīng)版權(quán)人許可的作品使用行為面臨著侵權(quán)風(fēng)險(xiǎn)。本文作者認(rèn)為,著作權(quán)法應(yīng)將此種作品使用行為納入合理使用范疇,并從合法來(lái)源要求、權(quán)利人 選擇—退出 機(jī)制、模型提供者承擔(dān)披露訓(xùn)練內(nèi)容的義務(wù)3個(gè)方面設(shè)置適用限制條件,明晰版權(quán)人權(quán)益與生成式人工智能數(shù)據(jù)訓(xùn)練合法性的界限! ¢_(kāi)發(fā)生成式人工智能模型,需要以海量文本、圖像、視頻等包含受版權(quán)保護(hù)的作品作為語(yǔ)料進(jìn)行數(shù)據(jù)訓(xùn)練,若未經(jīng)權(quán)利人許可,則面臨版權(quán)侵權(quán)風(fēng)險(xiǎn)。數(shù)據(jù)訓(xùn)練中的作品使用行為構(gòu)成侵權(quán)抑或合理使用,已成為實(shí)踐中相關(guān)糾紛的核心爭(zhēng)議焦點(diǎn)。我國(guó)合理使用制度采用封閉式的立法技術(shù),現(xiàn)行著作權(quán)法窮盡式列舉的合理使用條款無(wú)法涵蓋這一新興場(chǎng)景下的作品使用行為。因此,在期待司法予以能動(dòng)回應(yīng)的同時(shí),有必要探索如何革新著作權(quán)法規(guī)則,以明晰版權(quán)人權(quán)益與生成式人工智能數(shù)據(jù)訓(xùn)練合法性的界限,兼顧版權(quán)保護(hù)與產(chǎn)業(yè)發(fā)展! 〖{入合理使用范疇  筆者認(rèn)為,基于生成式人工智能數(shù)據(jù)訓(xùn)練對(duì)作品使用具有轉(zhuǎn)換性目的的技術(shù)本質(zhì),可以考慮將其納入合理使用范疇。生成式人工智能是計(jì)算機(jī)深度學(xué)習(xí)算法的一大應(yīng)用,其通過(guò)數(shù)據(jù)訓(xùn)練提取、學(xué)習(xí)文字、圖像、音符等符號(hào)的分布規(guī)律和組合特征。海量數(shù)據(jù)訓(xùn)練旨在增強(qiáng)生成模型的泛化性能,即確保模型能夠準(zhǔn)確處理來(lái)自相同數(shù)據(jù)分布的新樣本,使其面對(duì)未知用戶指令仍能靈活生成內(nèi)容?梢(jiàn),作品作為訓(xùn)練語(yǔ)料的意義在于提高生成模型類似于人類學(xué)習(xí)過(guò)程中的 理解 能力,而非再現(xiàn)作品的具體表達(dá)并供公眾欣賞其藝術(shù)價(jià)值。實(shí)際上,如果模型因過(guò)度記憶訓(xùn)練語(yǔ)料而輸出與語(yǔ)料實(shí)質(zhì)相似的內(nèi)容,將被視為技術(shù)錯(cuò)誤! ⑸墒饺斯ぶ悄軘(shù)據(jù)訓(xùn)練納入合理使用范疇使之合法化,也符合著作權(quán)法促進(jìn)文學(xué)藝術(shù)作品創(chuàng)作與傳播的公共利益要求。經(jīng)過(guò)技術(shù)的不斷迭代,人工智能已能生成外觀上與人類創(chuàng)作作品幾乎無(wú)異的內(nèi)容,在質(zhì)量上能夠滿足一定程度的欣賞需求。例如,中央廣播電視總臺(tái)推出的微短劇《中國(guó)神話》,借助 文生圖 圖生視頻 等生成式人工智能技術(shù)拓展了人們對(duì)神話的常規(guī)想象,再通過(guò)經(jīng)典意象和當(dāng)下人類社會(huì)的深度鏈接,給觀眾帶來(lái)了前所未有的視聽(tīng)享受。作為人類創(chuàng)作的輔助工具,生成式人工智能可以豐富創(chuàng)作素材,提升創(chuàng)作效率與質(zhì)量,由此促進(jìn)文藝繁榮。因此,為解決人工智能版權(quán)侵權(quán)風(fēng)險(xiǎn)與其作品使用需求之間的矛盾,合理使用是具有正當(dāng)性的制度選擇! 『侠泶_定限制條件  由于版權(quán)作品被用于數(shù)據(jù)訓(xùn)練能夠創(chuàng)造商業(yè)收益,且高質(zhì)量的生成內(nèi)容可能構(gòu)成對(duì)版權(quán)作品潛在市場(chǎng)的競(jìng)爭(zhēng)替代,因此,作品用于數(shù)據(jù)訓(xùn)練事實(shí)上已成為人工智能時(shí)代新的作品利用形式,如何保障權(quán)利人的利益是不容忽視的問(wèn)題。在合理使用的具體規(guī)則中,應(yīng)當(dāng)通過(guò)適用限制條件的合理設(shè)計(jì)解決此問(wèn)題。參考域外的立法探索,可以從合法來(lái)源要求、權(quán)利人 選擇—退出 機(jī)制、模型提供者承擔(dān)披露訓(xùn)練內(nèi)容的義務(wù)3方面進(jìn)行限制! 『戏▉(lái)源要求意味著作品應(yīng)當(dāng)是通過(guò)訂閱等合同安排獲得權(quán)利人授權(quán),或是基于合理使用、法定許可等規(guī)則而合法接觸的,否則將作品用于數(shù)據(jù)訓(xùn)練仍需獲得授權(quán)。通過(guò)這一限制,權(quán)利人仍能夠保護(hù)其版權(quán)內(nèi)容,通過(guò)收取訪問(wèn)費(fèi)用等方式保障其經(jīng)濟(jì)利益。需注意的是,還應(yīng)明確權(quán)利人仍能夠采取技術(shù)保護(hù)措施。對(duì)于已設(shè)置反爬蟲(chóng)措施或防抓取措施的網(wǎng)絡(luò)內(nèi)容,經(jīng)破解后接觸作品的,也屬于非法接觸,排除合理使用規(guī)則的適用。   選擇—退出 機(jī)制賦予權(quán)利人主動(dòng)決定其作品是否參與生成式人工智能數(shù)據(jù)訓(xùn)練的權(quán)利。這一機(jī)制在實(shí)踐中已被廣泛應(yīng)用,成為平衡技術(shù)進(jìn)步與版權(quán)保護(hù)的重要工具。例如,法國(guó)音樂(lè)作曲家、作者和出版者協(xié)會(huì)在2023年10月發(fā)表聲明,稱將選擇退出其曲目作品的機(jī)器學(xué)習(xí),表示使用其曲目作品須獲得授權(quán),并明確協(xié)商利用條件。再如,某人工智能公司創(chuàng)建了網(wǎng)站,該網(wǎng)站允許創(chuàng)作者選擇退出生成模型的訓(xùn)練數(shù)據(jù)集,截至2024年4月已有10億余件藝術(shù)作品退出。公眾耳熟能詳?shù)墓雀、微軟、Open AI公司亦通過(guò)擴(kuò)展爬蟲(chóng)協(xié)議,為權(quán)利人提供便捷的選項(xiàng),允許他們將網(wǎng)絡(luò)作品排除在相關(guān)模型訓(xùn)練之外。   選擇—退出 機(jī)制介于數(shù)據(jù)訓(xùn)練使用作品的授權(quán)模式和傳統(tǒng)合理使用模式二者之間,是人工智能時(shí)代加強(qiáng)權(quán)利人保護(hù)與促進(jìn)產(chǎn)業(yè)發(fā)展二者間的妥協(xié)方案。在這一機(jī)制下,除非權(quán)利人主動(dòng)行使退出權(quán),否則作品原則上可被用于數(shù)據(jù)訓(xùn)練而無(wú)需個(gè)別授權(quán),由此能夠降低版權(quán)許可的高昂成本,也緩解了因獲得許可困難而導(dǎo)致的訓(xùn)練語(yǔ)料匱乏,以及因此加劇的算法偏見(jiàn)等問(wèn)題。同時(shí),區(qū)別于傳統(tǒng)合理使用模式偏向絕對(duì)性的自由無(wú)償使用,版權(quán)人有權(quán)保留其作品被無(wú)償?shù)赜糜跀?shù)據(jù)訓(xùn)練,通過(guò)行使選擇退出權(quán)以此換取協(xié)商議價(jià)空間,增強(qiáng)在許可談判中的議價(jià)能力。 選擇—退出 機(jī)制的靈活方案能夠適應(yīng)技術(shù)變革,既考慮到人工智能時(shí)代對(duì)數(shù)據(jù)處理的需求,又兼顧權(quán)利人的合法權(quán)益,有助于解決傳統(tǒng)合理使用模式可能對(duì)權(quán)利人造成不合理?yè)p害的適用困境! ∧P吞峁┱叱袚(dān)披露訓(xùn)練內(nèi)容的義務(wù),這一要求根植于生成式人工智能數(shù)據(jù)訓(xùn)練的固有不可追溯特性與日益增長(zhǎng)的透明度需求之中。以聊天機(jī)器人等大型語(yǔ)言模型為例,在其數(shù)據(jù)訓(xùn)練過(guò)程中,海量的書(shū)籍等文本資料被轉(zhuǎn)化為數(shù)十億計(jì)的序列數(shù)據(jù),隨后,算法會(huì)計(jì)算這些序列中每個(gè)語(yǔ)詞后續(xù)語(yǔ)詞出現(xiàn)的概率。然而,由于模型最終僅保留了原始語(yǔ)料的概率統(tǒng)計(jì)表示形式,因此,基于此類模型輸出的句子、文章等具體內(nèi)容,往往難以追溯其特定的原始來(lái)源。  正是基于這一背景,要求模型提供者公開(kāi)其訓(xùn)練內(nèi)容,以提升數(shù)據(jù)訓(xùn)練過(guò)程的透明度,顯得尤為重要。這一做法不僅能夠有效保障權(quán)利人對(duì)其作品使用情況的知情權(quán),而且還是權(quán)利人有效行使退出權(quán)的重要前提。換言之,權(quán)利人只有充分了解其作品如何被用于模型訓(xùn)練后,才能做出是否允許其作品被用于此類用途的決定! 〈送猓(xùn)練內(nèi)容的公開(kāi)披露還有助于簡(jiǎn)化輸出端可能出現(xiàn)的侵權(quán)判斷過(guò)程。當(dāng)監(jiān)督機(jī)構(gòu)或權(quán)利人需要判斷某一作品是否被非法地、專門(mén)用于生成實(shí)質(zhì)性相似的表達(dá)時(shí),公開(kāi)的訓(xùn)練內(nèi)容將成為重要的參考依據(jù),從而大大降低侵權(quán)判定的難度和復(fù)雜性。因此,模型提供者披露訓(xùn)練內(nèi)容的義務(wù),不僅是透明度和知情權(quán)保障的體現(xiàn),也是維護(hù)創(chuàng)作生態(tài)健康、促進(jìn)技術(shù)創(chuàng)新與版權(quán)保護(hù)和諧共生的關(guān)鍵一環(huán)。版權(quán)前沿|明確人工智能數(shù)據(jù)訓(xùn)練的版權(quán)邊界
# 版權(quán)前沿 | 明確人工智能數(shù)據(jù)訓(xùn)練的版權(quán)邊界 隨著人工智能技術(shù)的飛速發(fā)展,其應(yīng)用場(chǎng)景越來(lái)越廣泛,對(duì)數(shù)據(jù)的需求也日益增長(zhǎng)。在數(shù)據(jù)訓(xùn)練過(guò)程中,涉及到的版權(quán)問(wèn)題也愈發(fā)復(fù)雜。本文將探討人工智能數(shù)據(jù)訓(xùn)練中的版權(quán)邊界問(wèn)題,并提出相應(yīng)的解決方案。 ## 一、人工智能數(shù)據(jù)訓(xùn)練的版權(quán)歸屬 在人工智能數(shù)據(jù)訓(xùn)練中,涉及到數(shù)據(jù)的采集、整理、標(biāo)注等環(huán)節(jié)。對(duì)于這些數(shù)據(jù)的版權(quán)歸屬,需要根據(jù)具體情況進(jìn)行判斷。 一般來(lái)說(shuō),數(shù)據(jù)采集者享有數(shù)據(jù)的版權(quán),但在數(shù)據(jù)使用過(guò)程中,需要遵守相關(guān)法律法規(guī)和合同約定,不得侵犯他人的合法權(quán)益。對(duì)于數(shù)據(jù)整理和標(biāo)注者,其勞動(dòng)成果也應(yīng)受到法律保護(hù)。 ## 二、人工智能生成物的版權(quán)歸屬 人工智能在數(shù)據(jù)訓(xùn)練的基礎(chǔ)上,可以生成新的作品,如文章、音樂(lè)、繪畫(huà)等。對(duì)于這些生成物的版權(quán)歸屬,同樣存在爭(zhēng)議。 一種觀點(diǎn)認(rèn)為,人工智能生成物是基于訓(xùn)練數(shù)據(jù)生成的,其版權(quán)應(yīng)歸屬于數(shù)據(jù)提供者。另一種觀點(diǎn)則認(rèn)為,人工智能生成物具有一定的創(chuàng)造性,其版權(quán)應(yīng)歸屬于開(kāi)發(fā)者或使用者。 ## 三、合理使用與授權(quán)許可 在人工智能數(shù)據(jù)訓(xùn)練過(guò)程中,需要合理使用他人的作品,以避免侵權(quán)行為的發(fā)生。根據(jù)《著作權(quán)法》的規(guī)定,合理使用是指在特定情況下,無(wú)需獲得著作權(quán)人的授權(quán),即可使用他人的作品。 對(duì)于商業(yè)性的數(shù)據(jù)訓(xùn)練,通常需要獲得著作權(quán)人的授權(quán)許可,并支付相應(yīng)的版權(quán)費(fèi)用。在授權(quán)許可過(guò)程中,需要明確授權(quán)范圍、使用方式、使用期限等具體事項(xiàng),以避免侵權(quán)風(fēng)險(xiǎn)。 ## 四、建立數(shù)據(jù)共享機(jī)制 為了促進(jìn)人工智能技術(shù)的發(fā)展,需要建立數(shù)據(jù)共享機(jī)制,以提高數(shù)據(jù)的利用效率。在數(shù)據(jù)共享過(guò)程中,需要明確數(shù)據(jù)的版權(quán)歸屬和使用方式,以保護(hù)數(shù)據(jù)提供者的合法權(quán)益。 同時(shí),建立數(shù)據(jù)共享機(jī)制還可以促進(jìn)數(shù)據(jù)的流通和交易,為人工智能企業(yè)提供更多的數(shù)據(jù)資源,推動(dòng)技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展。 ## 五、加強(qiáng)版權(quán)保護(hù)與監(jiān)管 為了保護(hù)人工智能數(shù)據(jù)訓(xùn)練中的版權(quán),需要加強(qiáng)版權(quán)保護(hù)與監(jiān)管。一方面,需要完善相關(guān)法律法規(guī),明確人工智能數(shù)據(jù)訓(xùn)練中的版權(quán)歸屬和侵權(quán)責(zé)任。另一方面,需要加強(qiáng)版權(quán)執(zhí)法力度,打擊侵權(quán)盜版行為,維護(hù)市場(chǎng)秩序。 ## 六、結(jié)論 人工智能數(shù)據(jù)訓(xùn)練中的版權(quán)邊界問(wèn)題是一個(gè)復(fù)雜的法律問(wèn)題,需要根據(jù)具體情況進(jìn)行判斷。為了促進(jìn)人工智能技術(shù)的發(fā)展,需要明確版權(quán)歸屬、合理使用、授權(quán)許可、建立數(shù)據(jù)共享機(jī)制、加強(qiáng)版權(quán)保護(hù)與監(jiān)管等措施,以保護(hù)數(shù)據(jù)提供者和開(kāi)發(fā)者的合法權(quán)益,促進(jìn)人工智能技術(shù)的健康發(fā)展。

官方微博:@全影網(wǎng) https://weibo.com/7192com

官方微信:想在手機(jī)上獲取最新鮮資訊嗎?添加全影網(wǎng)官方微信:www7192com

免責(zé)聲明:

本站部分內(nèi)容、觀點(diǎn)、圖片、文字、視頻來(lái)自網(wǎng)絡(luò),僅供大家學(xué)習(xí)和交流,真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾。如果本站有涉及侵犯您的版權(quán)、著作權(quán)、肖像權(quán)的內(nèi)容,請(qǐng)聯(lián)系我們(0536-8337192),我們會(huì)立即審核并處理。

我要評(píng)論

當(dāng)前已有loading...個(gè)參與
驗(yàn)證碼: 驗(yàn)證碼,看不清楚?請(qǐng)點(diǎn)擊刷新驗(yàn)證碼
熱門(mén)作品

名企招聘

人才求職

婚紗攝影

人才網(wǎng)X 關(guān)閉

掃描訪問(wèn)手機(jī)版