隨著人工智能從文本轉(zhuǎn)向機(jī)器人,訓(xùn)練數(shù)據(jù)之爭(zhēng)正在進(jìn)入一個(gè)新階段。波塞冬在a16 z的支持下,將自己定位為下一代數(shù)據(jù)經(jīng)濟(jì)的仲裁者,其出處和許可是不可談判的。
7月22日,基于Story Protocol構(gòu)建的以人工智能為中心的去中心化數(shù)據(jù)層Poseidon宣布了由Andreessen Horowitz的加密貨幣部門領(lǐng)投的1500萬(wàn)美元種子輪,主要行業(yè)支持者也參與其中。
Poseidon由Story孵化,人工智能研究員Sandeep Chinchali和工程師Sarick Shah共同創(chuàng)立,進(jìn)入市場(chǎng)的使命明確:解鎖、結(jié)構(gòu)和許可下一代人工智能系統(tǒng)需要但目前缺乏的現(xiàn)實(shí)世界數(shù)據(jù)。
該初創(chuàng)公司表示,其基礎(chǔ)設(shè)施旨在促進(jìn)長(zhǎng)尾物理數(shù)據(jù)的收集和管理,包括家務(wù)的第一人稱視頻和多語(yǔ)言語(yǔ)音記錄,同時(shí)在協(xié)議級(jí)別對(duì)IP出處進(jìn)行編碼。
包括a16 z加密貨幣在內(nèi)的Poseidon支持者押注該公司可以成為數(shù)據(jù)貢獻(xiàn)者和開發(fā)人員之間的結(jié)締組織,開發(fā)人員構(gòu)建在瀏覽器之外運(yùn)行的人工智能系統(tǒng)。
海神計(jì)劃如何解決人工智能的數(shù)據(jù)荒
波塞冬的框架基于四項(xiàng)核心原則,每項(xiàng)原則都解決了當(dāng)今人工智能培訓(xùn)管道中的一個(gè)關(guān)鍵缺陷。首先,其需求優(yōu)先的設(shè)計(jì)顛覆了傳統(tǒng)模式:波塞冬沒有希望貢獻(xiàn)者上傳有用的數(shù)據(jù),而是識(shí)別人工智能開發(fā)人員實(shí)際需要什么,并系統(tǒng)性地激勵(lì)其收集。
其次,去中心化規(guī)模承認(rèn)現(xiàn)實(shí)世界的多樣性是無(wú)法偽造的;該平臺(tái)使用智能手機(jī)SDK和專業(yè)應(yīng)用程序在全球范圍內(nèi)眾包數(shù)據(jù),確保區(qū)域和情景多樣性。
第三,結(jié)構(gòu)化驗(yàn)證確保原始輸入被清除重復(fù)項(xiàng)、針對(duì)管道進(jìn)行標(biāo)準(zhǔn)化并豐富元數(shù)據(jù),解決困擾許多人工智能數(shù)據(jù)集的“垃圾輸入、垃圾輸出”問題。最后,IP許可默認(rèn)通過Story Protocol的區(qū)塊鏈將法律清晰度嵌入到每一項(xiàng)資產(chǎn)中,避開了導(dǎo)致OpenAI的Whisper等項(xiàng)目陷入停滯的版權(quán)地雷。
波塞冬表示,該架構(gòu)充當(dāng)人工智能數(shù)據(jù)約束的全棧解決方案。在收集層,其工具范圍從針對(duì)臨時(shí)貢獻(xiàn)者的輕量級(jí)移動(dòng)集成到針對(duì)專業(yè)數(shù)據(jù)的專用硬件合作伙伴關(guān)系。
一旦攝入,機(jī)器學(xué)習(xí)管道就會(huì)自動(dòng)化策展,剝離個(gè)人可識(shí)別信息,標(biāo)記低質(zhì)量樣本,并將邊緣案例發(fā)送給人類審查員。
然而,最具破壞性的因素是它的IP管理:每個(gè)數(shù)據(jù)集都被鑄造為Story區(qū)塊鏈上的可組合資產(chǎn),智能合同強(qiáng)制執(zhí)行出處和版稅分割。