近年來,大數(shù)據(jù)、5G、AI技術(shù)應(yīng)用快速發(fā)展,助力我國教育信息化水平不斷提升,并催生大量在線教育新場景、新模式、新業(yè)態(tài),有效滿足人們多樣化學(xué)習(xí)需求。
5月13日,在北京師范大學(xué)珠海校區(qū),作業(yè)幫首席算法專家宋旸受邀和該校統(tǒng)計學(xué)院應(yīng)用統(tǒng)計專業(yè)碩士生進行了分享。宋旸就統(tǒng)計學(xué)在具體場景下的實踐、泛AI技術(shù)在產(chǎn)品業(yè)務(wù)中發(fā)揮的作用等方面進行了講解。
宋旸同時受聘為北京師范大學(xué)統(tǒng)計學(xué)院應(yīng)用統(tǒng)計專業(yè)碩士兼職導(dǎo)師。
分享現(xiàn)場
數(shù)據(jù)思維貫穿研發(fā)迭代全過程
據(jù)了解,作業(yè)幫旗下產(chǎn)品日活超5000萬,月活突破1.7億,擁有3億的大數(shù)據(jù)題庫,每天都在源源不斷地產(chǎn)生海量數(shù)據(jù)。如何把數(shù)據(jù)轉(zhuǎn)化成工作中的生產(chǎn)力,變成企業(yè)的競爭力,是日常研發(fā)與產(chǎn)品迭代中都面臨的課題。
宋旸介紹,將數(shù)據(jù)思維貫穿在作業(yè)幫產(chǎn)品實驗、分析、優(yōu)化過程,有助于作業(yè)幫完善產(chǎn)品功能。例如,作業(yè)幫的海量知識點重要性均是根據(jù)學(xué)生搜題頻次等多項數(shù)據(jù)而定。
此外,作業(yè)幫對于數(shù)據(jù)細節(jié)處理十分重視,宋旸認為不同的理解和認知,不同的處理經(jīng)驗和技巧,都會對最終結(jié)果產(chǎn)生重要影響。以拍照搜題為例,為了更好地對拍照搜題每天產(chǎn)生的過億張圖片進行隨機抽取處理,作業(yè)幫對多種算法進行深入比較,全面分析利弊,最終找出全新算法策略。宋旸表示,“在統(tǒng)計算法加持下,任何小問題都會變得優(yōu)雅且高效。”
數(shù)據(jù)分析帶來精準洞察 泛AI技術(shù)激發(fā)產(chǎn)品潛力
數(shù)據(jù)分析為作業(yè)幫具體業(yè)務(wù)帶來了精準洞察。為了讓用戶擁有更好地體驗,作業(yè)幫會基于數(shù)據(jù)的分析進行改進。
統(tǒng)計學(xué)也為產(chǎn)品帶來了算法利益,泛AI技術(shù)的應(yīng)用則進一步激發(fā)了作業(yè)幫產(chǎn)品的潛力。據(jù)了解,目前,圖像、計算推理、檢索及NLP、語音、基礎(chǔ)數(shù)據(jù)挖掘等基礎(chǔ)技術(shù),已成熟應(yīng)用在口算批改、拍照搜題、智能客服等多項產(chǎn)品中。
以拍照搜題為例,在日常應(yīng)用中存在光照不均、異常模糊、傾斜扭曲等難點,作業(yè)幫利用圖像與OCR技術(shù)完整識別流水線,包含超過30種神經(jīng)網(wǎng)絡(luò),針對上述難點專項解決。文字的一次識別需要260次以上神經(jīng)網(wǎng)絡(luò)預(yù)測,平均耗時僅需200ms,每分鐘響應(yīng)高達100萬次搜題請求。
與此同時,語音技術(shù)、自然語言處理技術(shù)、機器學(xué)習(xí)技術(shù)等AI技術(shù)也廣泛應(yīng)用在作業(yè)幫的教學(xué)實踐中。在課堂語音彈幕應(yīng)用中,語音技術(shù)能夠成功識別老師的語音,并據(jù)此匹配特殊顏色等互動內(nèi)容,有效吸引學(xué)生注意力,調(diào)動課堂互動積極性。
宋旸表示,從數(shù)據(jù)分析到數(shù)據(jù)洞察,作業(yè)幫讓數(shù)據(jù)在每一個細節(jié)上發(fā)揮重大作用,并指導(dǎo)產(chǎn)品的最終決策。在統(tǒng)計學(xué)與AI技術(shù)應(yīng)用的雙驅(qū)動下,作業(yè)幫產(chǎn)品不斷趨于完善,持續(xù)刷新用戶使用體驗。