早报网

網(wǎng)站地圖 - 關(guān)于我們
您的當(dāng)前位置: 首頁 > 科技 > 業(yè)內(nèi) 正文

人工智能訓(xùn)練師:讓機器更“懂”人類

作者:admin 時間:2023-07-31 06:17 點擊:
導(dǎo)讀:

  人工智能訓(xùn)練師:

  讓機器更“懂”人類(新職?新知③)

  彭訓(xùn)文 張嘉幸 《 人民日報海外版 》( 2023年07月31日 第 05 版)

  打開電腦,將采集的風(fēng)聲、雨聲、溪流聲等聲音數(shù)據(jù)輸入,“清洗”掉夾雜其間的噪音,對助聽器數(shù)據(jù)模型進行“訓(xùn)練”,測試模型在真實場景的靈敏度……伴隨著手指敲擊鍵盤的“啪嗒啪嗒”聲,騰訊天籟實驗室人工智能訓(xùn)練師付聰一天的工作就此開始。

  近幾年,隨著人工智能技術(shù)不斷發(fā)展,這個被稱為人工智能訓(xùn)練師的職業(yè)逐漸壯大。作為“數(shù)字職業(yè)”之一,人工智能訓(xùn)練師的出現(xiàn),加速了人工智能由技術(shù)研發(fā)走向行業(yè)應(yīng)用的過程,將產(chǎn)生較高的經(jīng)濟價值和社會價值。

  為模型不斷“喂”數(shù)據(jù)

  每次出門時,付聰總會在耳朵上戴一個大“耳環(huán)”。

  這個“耳環(huán)”其實是一個測試版的助聽器?!岸h(huán)”里的聲音各式各樣,有呼呼的噪聲,有尖銳刺耳的吵鬧聲……這些經(jīng)過助聽器放大后產(chǎn)生的噪聲,是很多佩戴助聽器的聽障人士長期面臨的困擾。

  付聰和他的團隊正在嘗試利用算法設(shè)計、通過人工智能技術(shù)“訓(xùn)練”數(shù)據(jù)模型,讓助聽器更加“智慧”地降低噪聲,讓聽障人群聽得清、聽得懂、聽得舒服。

  付聰解釋說,助聽器數(shù)據(jù)模型很小,因此需要針對不同場景進行優(yōu)化,很多場景充滿挑戰(zhàn),“比如一個聽障人士在餐廳吃飯,周圍有很多人說話,他想跟對面的人聊天,四周聲音特別嘈雜,作為一個正常人都可能聽不清楚,更何況一個有聽力障礙的人?我們希望利用模型,把需要的聲音提取出來,降低噪聲,幫助更多聽障人群”。

  理想很豐滿,但是實際的模型算法研發(fā)過程卻像是一場反復(fù)進行的“戰(zhàn)役”。

  模型的研發(fā)過程大致分為以下幾步:數(shù)據(jù)采集、數(shù)據(jù)“清洗”、模型訓(xùn)練、場景測試、調(diào)整算法,經(jīng)過幾次迭代之后再測試、調(diào)整,“如果測試結(jié)果不理想,需要把這個過程再走一遍,直到得到最優(yōu)效果”。付聰說。

  數(shù)據(jù)采集要有針對性。為了讓模型更“聰明”,需要針對不同場景采集各種特殊數(shù)據(jù)。付聰和團隊成員不僅需要到早晚高峰的地鐵、熱鬧喧天的餐廳、人來人往的馬路等場景,采集數(shù)百個小時的聲音數(shù)據(jù),還要戴上助聽器體驗這些聲音的差別,“比如風(fēng)聲,正常人聽到是呼呼聲,但戴上助聽器以后,是很吵的噗噗聲,像是去KTV唱歌,聲音使勁砸到麥克風(fēng)上”。道路騎行、海邊風(fēng)浪……為了采集各種風(fēng)噪數(shù)據(jù),付聰錄制了多種場景的風(fēng)聲。

  數(shù)據(jù)“清洗”是將不需要的數(shù)據(jù)“洗掉”。付聰舉了一個例子――風(fēng)聲,真實場景下會夾雜汽車鳴笛、人交談等聲音。在整理時要把這些數(shù)據(jù)剔除出來,保留一個比較純粹的風(fēng)聲,這樣模型才會“認識”風(fēng)。

  模型訓(xùn)練是將“清洗”好的數(shù)據(jù)“喂”給模型。除了采集的特殊數(shù)據(jù),付聰和他的同事們還會加入諸如世界各國的語言和一些非語音聲音等數(shù)據(jù),“基本涵蓋了人們生活中遇到的所有噪聲和語音”。

  和人類不同,人工智能模型在訓(xùn)練過程中,不會疲憊、煩躁、發(fā)脾氣,它們的“智慧”取決于模型參數(shù)、訓(xùn)練策略、數(shù)據(jù)量等。“它們就像一個‘孩子’,會越來越‘聰明’,識別到越來越多的聲音,我特別有成就感?!备堵斦f。

  考驗?zāi)托摹⒓氈潞腿淌芰?/p>

  模型訓(xùn)練完成后,并不意味立刻能應(yīng)用到聽障人群的助聽器上,還要經(jīng)歷較長時間的迭代、調(diào)整過程。

  比如,為了讓聽障人群適配到合適的助聽器,傳統(tǒng)方式是患者反復(fù)到線下的驗配店去試戴,過程繁雜。付聰解釋說,一般情況下,根據(jù)發(fā)病原因不同可以將聽力下降分為三類:感音神經(jīng)性、傳導(dǎo)性、混合性耳聾;根據(jù)聽力下降的程度不同,分為輕度、中度、重度及極重度耳聾。針對不同的類型,助聽器的適配方式有所不同。

  有沒有可能把適配過程搬到“線上”,利用人工智能算法和深度學(xué)習(xí)能力,讓聽障人群在線上就能做準確的聽力驗配?帶著這個疑問,付聰開始研發(fā)適配算法。他將這個過程比喻為做應(yīng)用題,需要查詢國內(nèi)外文獻、檢索現(xiàn)有方案,根據(jù)具體的使用環(huán)境,利用現(xiàn)有知識開展合理想象、設(shè)計實驗、尋找答案。

  這個過程考驗人工智能訓(xùn)練師的耐心、細致。在測試助聽器音質(zhì)時,不同的佩戴方式,對應(yīng)不同的測試結(jié)果。付聰和同事需要以“N×N”排列組合設(shè)計不同的佩戴方式,并且不斷重復(fù)試驗,來研究其對音質(zhì)產(chǎn)生的影響。

  這個過程十分考驗人工智能訓(xùn)練師的忍受力?!耙粋€人工智能訓(xùn)練師的基本素養(yǎng),就是強迫自己聽很多次刺耳的聲音?!备堵敱硎荆@是因為訓(xùn)練師需要定量衡量聽障患者能正常聽到的聲音極限點,而這些聲音的分貝數(shù)是正常人耳難以忍受的,“很多時候恨不得把耳機摔掉。經(jīng)過一天測試,整個腦袋都感覺疼”。

  經(jīng)過不斷迭代、調(diào)整,內(nèi)置了算法的助聽器終于完成了。最讓付聰難忘的是他們第一次到廣東韶關(guān)捐贈產(chǎn)品,他們把助聽器挨個交到聽障老人手上,開機、戴設(shè)備、調(diào)整增益……“雖然我對模型很有信心,但當(dāng)時還是感覺心提到了嗓子眼,因為在此之前,老人們是無法正常交流的?!备堵斦f。

  他小心地詢問一個老人:“您能聽到我在說什么嗎?”

  “可以了?!崩先司徛謭远ǖ貜目谥姓f出3個字。

  “那時候我覺得,我們做的這個事情挺有意義的。”付聰說。

  用技術(shù)解決人類需求

  人工智能訓(xùn)練師是一個需要忍受孤獨的職業(yè),因為他們大量的時間是在設(shè)計方案、寫代碼、采集數(shù)據(jù)、訓(xùn)練模型中度過的。

  “我戰(zhàn)勝孤獨的秘密是興趣?!备堵?shù)膶I(yè)是通信,其中很多課程和信號處理相關(guān),他平時比較喜歡音樂,因此就將自己的興趣和專業(yè)、工作結(jié)合起來,聚焦音頻領(lǐng)域,大學(xué)畢業(yè)后參與了很多有關(guān)音頻信號處理的工作,經(jīng)歷了音頻算法從傳統(tǒng)算法到人工智能算法,再到大規(guī)模深度學(xué)習(xí)的各個階段。

  在付聰看來,人工智能技術(shù)是一個很好的工具,目的是將人類從很多腦力勞動中解放出來,用規(guī)?;姆绞饺ヌ娲壳俺杀据^高的個體勞動。對整個社會而言,這是一種生產(chǎn)力的進步,有著巨大的社會價值和商業(yè)價值。

  成熟的人工智能技術(shù)是什么樣?付聰認為需要經(jīng)過3個階段:一是感知智能,核心在于模擬人的視覺、聽覺和觸覺等感知能力,比如人臉識別、語音識別等;二是認知智能,具有人類思維理解、知識共享、行動協(xié)同或博弈等特征,“能夠真正理解人在說什么,根據(jù)一些提示,提供相對完整的回答”;三是行為智能,也就是像自動駕駛一樣,真正可以在物理世界發(fā)揮作用。

  達到這樣的目標,需要對人工智能模型不斷進行訓(xùn)練。付聰表示,首先需要針對問題準備足夠多的數(shù)據(jù),“多到盡量涵蓋解決這個問題時所遇到的所有情形”;其次需要設(shè)計很好的算法,并根據(jù)用戶反饋不斷優(yōu)化。

  “人工智能技術(shù)領(lǐng)域日新月異,要求人工智能訓(xùn)練師有廣闊的視野、深厚的人文情懷和社會責(zé)任感,用業(yè)界最新想法、理念和正確的倫理觀來幫助人類解決生產(chǎn)生活中遇到的問題?!备堵斦f。

打賞

取消

感謝您的支持,我會繼續(xù)努力的!

掃碼支持
掃碼打賞,你說多少就多少

打開支付寶掃一掃,即可進行掃碼打賞哦

相關(guān)推薦:

網(wǎng)友評論:

推薦使用友言、多說、暢言(需備案后使用)等社會化評論插件

Copyright ? 2021 早報網(wǎng) 版權(quán)所有
蘇ICP備2024138443號

蘇公網(wǎng)安備32130202081338號

本網(wǎng)站所刊載信息,不代表早報網(wǎng)觀點。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權(quán)違法立即與我們聯(lián)系客服 106291126@qq.com 對其相關(guān)內(nèi)容進行刪除。
早報網(wǎng)登載文章只用于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。
《早報網(wǎng)》官方網(wǎng)站:www.m.amdoc.cn互聯(lián)網(wǎng)違法和不良信息舉報中心
Top 主站蜘蛛池模板: 东莞猎头公司_深圳猎头公司_广州猎头公司-广东万诚猎头提供企业中高端人才招聘服务 | 齿式联轴器-弹性联轴器-联轴器厂家-江苏诺兴传动联轴器制造有限公司 | 伸缩器_伸缩接头_传力接头-巩义市润达管道设备制造有限公司 | 高精度电阻回路测试仪-回路直流电阻测试仪-武汉特高压电力科技有限公司 | CCC验厂-家用电器|服务器CCC认证咨询-奥测世纪 | 气动球阀_衬氟蝶阀_调节阀_电动截止阀_上海沃托阀门有限公司 | 隐形纱窗|防护纱窗|金刚网防盗纱窗|韦柏纱窗|上海青木装潢制品有限公司|纱窗国标起草单位 | 火锅底料批发-串串香技术培训[川禾川调官网] | 高压油管,液压接头,液压附件-烟台市正诚液压附件 | CTP磁天平|小电容测量仪|阴阳极极化_双液系沸点测定仪|dsj电渗实验装置-南京桑力电子设备厂 | 定量包装秤,吨袋包装称,伸缩溜管,全自动包装秤,码垛机器人,无锡市邦尧机械工程有限公司 | 大功率金属激光焊接机价格_不锈钢汽车配件|光纤自动激光焊接机设备-东莞市正信激光科技有限公司 定制奶茶纸杯_定制豆浆杯_广东纸杯厂_[绿保佳]一家专业生产纸杯碗的厂家 | 纯水电导率测定仪-万用气体检测仪-低钠测定仪-米沃奇科技(北京)有限公司www.milwaukeeinst.cn 锂辉石检测仪器,水泥成分快速分析仪-湘潭宇科分析仪器有限公司 手术室净化装修-手术室净化工程公司-华锐手术室净化厂家 | 飞扬动力官网-广告公司管理软件,广告公司管理系统,喷绘写真条幅制作管理软件,广告公司ERP系统 | 智能化的检漏仪_气密性测试仪_流量测试仪_流阻阻力测试仪_呼吸管快速检漏仪_连接器防水测试仪_车载镜头测试仪_奥图自动化科技 | 粉末包装机-给袋式包装机-全自动包装机-颗粒-液体-食品-酱腌菜包装机生产线【润立机械】 | 沧州友城管业有限公司-内外涂塑钢管-大口径螺旋钢管-涂塑螺旋管-保温钢管生产厂家 | 无刷电机_直流无刷电机_行星减速机-佛山市藤尺机电设备有限公司 无菌检查集菌仪,微生物限度仪器-苏州长留仪器百科 | 民用音响-拉杆音响-家用音响-ktv专用音响-万昌科技 | 市政路灯_厂家-淄博信达电力科技有限公司 | 酶联免疫分析仪-多管旋涡混合仪|混合器-莱普特科学仪器(北京)有限公司 | 干粉砂浆设备_干混砂浆生产线_腻子粉加工设备_石膏抹灰砂浆生产成套设备厂家_干粉混合设备_砂子烘干机--郑州铭将机械设备有限公司 | 电动葫芦|环链电动葫芦-北京凌鹰名优起重葫芦 | 石油/泥浆/不锈钢防腐/砂泵/抽砂泵/砂砾泵/吸砂泵/压滤机泵 - 专业石油环保专用泵厂家 | 视觉检测设备_自动化检测设备_CCD视觉检测机_外观缺陷检测-瑞智光电 | 干粉砂浆设备_干混砂浆生产线_腻子粉加工设备_石膏抹灰砂浆生产成套设备厂家_干粉混合设备_砂子烘干机--郑州铭将机械设备有限公司 | 滤芯,过滤器,滤油机,贺德克滤芯,精密滤芯_新乡市宇清流体净化技术有限公司 | 环球电气之家-中国专业电气电子产品行业服务网站! | 湖州织里童装_女童男童中大童装_款式多尺码全_织里儿童网【官网】-嘉兴嘉乐网络科技有限公司 | 置顶式搅拌器-优莱博化学防爆冰箱-磁驱搅拌器-天津市布鲁克科技有限公司 | 石家庄装修设计_室内家装设计_别墅装饰装修公司-石家庄金舍装饰官网 | AGV叉车|无人叉车|AGV智能叉车|AGV搬运车-江西丹巴赫机器人股份有限公司 | 珠海白蚁防治_珠海灭鼠_珠海杀虫灭鼠_珠海灭蟑螂_珠海酒店消杀_珠海工厂杀虫灭鼠_立净虫控防治服务有限公司 | 氢氧化钙设备_厂家-淄博工贸有限公司| 无硅导热垫片-碳纤维导热垫片-导热相变材料厂家-东莞市盛元新材料科技有限公司 | 山东钢格板|栅格板生产厂家供应商-日照森亿钢格板有限公司 | UV固化机_UVLED光固化机_UV干燥机生产厂家-上海冠顶公司专业生产UV固化机设备 | 折弯机-刨槽机-数控折弯机-数控刨槽机-数控折弯机厂家-深圳豐科机械有限公司 | 超声波破碎仪-均质乳化机(供应杭州,上海,北京,广州,深圳,成都等地)-上海沪析实业有限公司 | 广州迈驰新GMP兽药包装机首页_药品包装机_中药散剂包装机 | 龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司_龙门加工中心-数控龙门加工中心厂家价格-山东海特数控机床有限公司 |