OpenAI thotë se ka prova që DeepSeek i ka vjedhur modelin

OpenAI thotë se ka gjetur prova që start-upi kinez i inteligjencës artificiale, DeepSeek, përdori modelet pronësore të kompanisë amerikane për të trajnuar konkurrentin e vet me burim të hapur, pasi shqetësimet rriten për një shkelje të mundshme të pronës intelektuale.

Prodhuesi i ChatGPT me bazë në San Francisco i tha Financial Times se kishte parë disa prova të “distilimit”, për të cilat dyshon se janë nga DeepSeek.

Teknika përdoret nga zhvilluesit për të përftuar performancë më të mirë në modelet më të vogla duke përdorur rezultate nga ato më të mëdha dhe më të afta, duke i lejuar ata të arrijnë rezultate të ngjashme në detyra specifike me një kosto shumë më të ulët.

Distilimi është një praktikë e zakonshme në industri, por shqetësimi ishte se DeepSeek mund ta bëjë atë për të ndërtuar modelin e tij rival, që është një shkelje e kushteve të shërbimit të OpenAI.

“Çështja është kur ju [e hiqni atë nga platforma dhe] po e bëni për të krijuar modelin tuaj për qëllimet tuaja,” tha një person i afërt me OpenAI.

OpenAI nuk pranoi të komentonte më tej ose të jepte detaje të provave të saj. Kushtet e tij të shërbimit thonë se përdoruesit nuk mund të “kopjojnë” asnjë nga shërbimet e tij ose “të përdorin daljen për të zhvilluar modele që konkurrojnë me OpenAI”.

Lëshimi i modelit të tij të arsyetimit R1 nga DeepSeek ka befasuar tregjet, si dhe investitorët dhe kompanitë e teknologjisë në Silicon Valley. Modelet e saj të ndërtuara mbi këpucë kanë arritur renditje të larta dhe rezultate të krahasueshme me modelet kryesore amerikane.

Aksionet e Nvidia ranë 17 për qind të hënën, duke fshirë 589 miliardë dollarë nga vlera e saj e tregut, nga frika se investimet e mëdha në pajisjet e saj të shtrenjta AI mund të mos nevojiten. Ata u rikuperuan me 9 për qind të martën, së bashku me aksionet e tjera të teknologjisë.

OpenAI dhe partneri i tij Microsoft hetuan llogaritë që besohej se ishin të DeepSeek vitin e kaluar që përdornin ndërfaqen e programimit të aplikacionit të OpenAI (API) dhe bllokuan aksesin e tyre me dyshimin për distilim që shkelte kushtet e shërbimit, tha një person tjetër me njohuri të drejtpërdrejta. Këto hetime u raportuan për herë të parë nga Bloomberg.

Microsoft nuk pranoi të komentonte dhe OpenAI nuk iu përgjigj menjëherë një kërkese për koment mbi këtë detaj. DeepSeek nuk iu përgjigj një kërkese për koment të bërë gjatë festës së vitit të ri hënor.

Më parë, AI i Presidentit Donald Trump dhe cari i kriptove, David Sacks, tha se “është e mundur” që të ketë ndodhur vjedhja e IP.

“Ekziston një teknikë në AI që quhet distilim”…kur një model mëson nga një model tjetër [dhe] disi thith njohuritë nga modeli prind, “tha Sacks për Fox News të martën.

“Dhe ka prova thelbësore se ajo që DeepSeek bëri këtu është se ata distiluan njohuritë nga modelet e OpenAI, dhe nuk mendoj se OpenAI është shumë i lumtur për këtë”, shtoi Sacks, megjithëse ai nuk dha prova.

DeepSeek tha se përdori vetëm 2,048 karta grafike Nvidia H800 dhe shpenzoi 5.6 milionë dollarë për të trajnuar modelin e tij V3 me 671 miliardë parametra, një pjesë e vogël e asaj që OpenAI dhe Google shpenzuan për të trajnuar modele me madhësi të krahasueshme.

Disa ekspertë thanë se modeli gjeneroi përgjigje që tregonin se ishte trajnuar për rezultatet nga GPT-4 e OpenAI, gjë që do të shkelte kushtet e shërbimit të tij.

Individët e industrisë thonë se është praktikë e zakonshme që laboratorët e AI në Kinë dhe SHBA të përdorin rezultatet nga kompani të tilla si OpenAI, të cilat kanë investuar në punësimin e njerëzve për të mësuar modelet e tyre se si të prodhojnë përgjigje që duken më njerëzore. Kjo është e shtrenjtë dhe kërkon punë intensive, dhe lojtarët më të vegjël shpesh e rikthejnë këtë punë, thonë të brendshëm.

“Është një praktikë shumë e zakonshme për fillestarët dhe akademikët që të përdorin rezultatet nga LLM-të komerciale të lidhura me njerëzit, si ChatGPT, për të trajnuar një model tjetër”, tha Ritwik Gupta, një kandidat për doktoraturë në AI në Universitetin e Kalifornisë, Berkeley.

“Kjo do të thotë që ju e merrni këtë hap të reagimit njerëzor falas. Nuk është për t’u habitur për mua që DeepSeek gjoja do të bënte të njëjtën gjë. Nëse do të ishin, ndalimi i kësaj praktike saktësisht mund të jetë i vështirë”, shtoi ai.

Praktika nxjerr në pah vështirësinë për kompanitë që dëshirojnë të mbrojnë avantazhet e tyre teknike. “Ne e dimë se kompanitë me bazë [Kinë] – dhe të tjera – po përpiqen vazhdimisht të distilojnë modelet e kompanive udhëheqëse të AI në SHBA”, tha OpenAI në deklaratën e tij të fundit.

Ai shtoi: “Ne angazhohemi në kundërmasa për të mbrojtur IP-në tonë, duke përfshirë një proces të kujdesshëm për të cilin aftësitë kufitare duhet të përfshihen në modelet e lëshuara dhe besojmë … është jashtëzakonisht e rëndësishme që ne po punojmë ngushtë me qeverinë amerikane për të mbrojtur më së miri modelet më të afta nga përpjekjet e kundërshtarëve dhe konkurrentëve për të marrë teknologjinë amerikane”.

OpenAI po lufton me akuzat për shkeljen e të drejtave të autorit nga gazetat dhe krijuesit e përmbajtjes, duke përfshirë padi nga The New York Times dhe autorë të shquar, të cilët akuzojnë kompaninë për trajnimin e modeleve të saj mbi artikujt dhe librat e tyre pa leje. /Albanianpost.com