人工智能場景落地爆發(fā),AI應(yīng)用如何利用數(shù)據(jù)突圍
當前,不管是人工智能技術(shù)的研發(fā)以及行業(yè)應(yīng)用的發(fā)展,“數(shù)據(jù)”都是一個不可或缺、位于重中之重的因素。作為人工智能基石的數(shù)據(jù),發(fā)揮出越來越重要的作用,影響著人工智能場景應(yīng)用的最終效果。現(xiàn)階段,在各個行業(yè)細分應(yīng)用場景的需求下,人工智能對數(shù)據(jù)的還原度、準確度提出了更高要求。
從細分結(jié)構(gòu)來看,隨著AI技術(shù)的不斷成熟,更多的場景和行業(yè)開始嵌入使用AI技術(shù),比如教育、法律、智能駕駛、銀行 金融 等,這些AI行業(yè)應(yīng)用場景逐漸趨于長尾和碎片化,產(chǎn)生了大量細分專業(yè)化的數(shù)據(jù)需求。對于人工智能應(yīng)用來說,AI數(shù)據(jù)的精準度失之毫厘則差之千里,而在人工智能應(yīng)用落地的過程中,AI數(shù)據(jù)精準度的差異會愈發(fā)的明顯。在這里以國內(nèi)頭部AI數(shù)據(jù)采集標注服務(wù)商云測數(shù)據(jù)為例,看看高質(zhì)量、場景化、精準化AI數(shù)據(jù)怎樣幫助人工智能加速 商業(yè) 化、落地化、產(chǎn)業(yè)化進程。
以智能駕駛 汽車 領(lǐng)域為例,AI算法訓練數(shù)據(jù)的“數(shù)量”與“質(zhì)量”非常重要——現(xiàn)實交通場景復雜、安全威脅多,非常重視數(shù)據(jù)分析的效率和敏捷,尤其是國內(nèi)路況的復雜性和相關(guān)智能應(yīng)用豐富的使用場景,更需要高質(zhì)、更精準的數(shù)據(jù)來進行算法訓練。
目前云測數(shù)據(jù)為智能駕駛企業(yè)提供的提供的解決方案分三部分。一是基礎(chǔ)數(shù)據(jù)集,二是定制化數(shù)據(jù)采集和標注服務(wù),三是包括數(shù)據(jù)采集標注、數(shù)據(jù)管理的全方位數(shù)據(jù)工具鏈。
“三個部分對應(yīng)不同層階段的自動駕駛落地需求。”云測數(shù)據(jù)總經(jīng)理賈宇航在接受 媒體 采訪時介紹,“第一個階段解決場景識別等基礎(chǔ)問題的通用數(shù)據(jù),例如車輛識別、車道線識別,這個階段涉及多種傳感器,需要大量布局;第二階段基于選定的場景,根據(jù)深度神經(jīng)網(wǎng)絡(luò)引入特定的數(shù)據(jù),云測數(shù)據(jù)場景實驗室和標注基地有實力滿足相應(yīng)數(shù)據(jù)的精度和規(guī)模;第三階段形成數(shù)據(jù)閉環(huán),云測數(shù)據(jù)可提供一整套成熟工具幫助完成數(shù)據(jù)采集、標注、管理一系列流程,幫助企業(yè)完成自身迭代。”
據(jù)了解,云測數(shù)據(jù)采集服務(wù)覆蓋智能駕駛主流應(yīng)用場景,擁有DMS與ADAS場景搭建采集經(jīng)驗,比如支持駕駛員信息備采、多模及車載語音采集等眾多類型。憑借高質(zhì)量的數(shù)據(jù)交付實力,云測數(shù)據(jù)已和業(yè)內(nèi)包括自主、合資車企,大型Tier1、Tier2,以及無人出租車、自動駕駛公司等眾多企業(yè),建立了持久良好的合作關(guān)系。
根據(jù)iResearch發(fā)布的《2020年中國AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展報告》:一個新研發(fā)的計算機視覺算法需要上萬張到數(shù)十萬張不等的標注圖片訓練;一個用于智慧城市的算法應(yīng)用,每年都有數(shù)十萬張圖片的穩(wěn)定需求;語音方面,頭部公司累計應(yīng)用的標注數(shù)據(jù)集已達百萬小時以上,每年需求仍以20%-30%的增速上升,不僅如此,隨著IoT設(shè)備的普及,語音交互場景越來越豐富,每年都有更多的新增場景和新需求方出現(xiàn),對于標注數(shù)據(jù)的需求也是逐步增長。
隨著人工智能落地需求的場景和專業(yè)化程度的增加,AI訓練數(shù)據(jù)本身的復雜度和種類也將不斷提升,人工智能需要的將是定制化、專業(yè)化、精細化的AI場景訓練數(shù)據(jù)產(chǎn)品服務(wù),具有相關(guān)工具、資源、能力的訓練數(shù)據(jù)服務(wù)商將發(fā)揮極大的競爭優(yōu)勢,成為發(fā)揮AI數(shù)據(jù)價值的“源泉之地”