【摘要】 針對“人工智能”課程實驗中存在的各種問題,提出在實驗教學(xué)中引入企業(yè)云服務(wù)平臺,支持實驗實訓(xùn)等實踐教學(xué)環(huán)節(jié)的方法。在云平臺的支持下,可以實現(xiàn)大數(shù)據(jù)量、高運算能力要求的AI算法實驗。云端實驗平臺的引入豐富了教學(xué)手段,解決了實驗算力不足、實驗數(shù)據(jù)存儲量不足、實驗過程難以監(jiān)控,以及實驗教學(xué)效果難以評價的問題。實驗平臺的引入有助于激發(fā)學(xué)生的主觀能動性和創(chuàng)新實踐能力。
劉麗玨; 陽春華; 陳白帆; 王雅琳; 高琰, 工業(yè)和信息化教育 發(fā)表時間:2021-10-22
【關(guān)鍵詞】人工智能;云實驗;ModelArts;AI平臺;交叉學(xué)科
0 引言
人工智能主要研究如何利用計算機和自動機去模擬、延伸、創(chuàng)造和擴展生物的智能,設(shè)計和建造具有擬人智能水平的智能系統(tǒng)[1],并把這類系統(tǒng)應(yīng)用到科學(xué)技術(shù)、國民經(jīng)濟、社會和人民生活的各領(lǐng)域。“人工智能”課程涉及認(rèn)知科學(xué)、計算機科學(xué)、控制論、生物信息學(xué)、數(shù)學(xué)、人工生命、腦科學(xué)、心理學(xué)、生理學(xué)和哲學(xué)等學(xué)科,是一門綜合性強、實踐性強、創(chuàng)新性強、應(yīng)用領(lǐng)域廣、多學(xué)科高度交叉的前沿課程[2]。
中南大學(xué)自動化學(xué)院設(shè)有智能科學(xué)與技術(shù)專業(yè),擁有國家級教學(xué)團隊——智能科學(xué)基礎(chǔ)系列課程教學(xué)團隊。“人工智能”課程已開設(shè)30余年,是國家級精品課程、國家級資源共享課、新世紀(jì)網(wǎng)絡(luò)課程、國家級雙語教學(xué)示范課程、國家級精品視頻公開課、中南金課、中南大學(xué)開放式精品示范課堂。“人工智能”課程以人工智能和智能系統(tǒng)理論為指導(dǎo),以智能機器人、智能識別和智能信息處理系統(tǒng)為應(yīng)用背景,依托精品課程群,發(fā)揮了示范作用[3]。
1 “人工智能”課程教學(xué)中存在的問題
隨著新一代深度感知、高速傳輸、海量存儲和智能處理等技術(shù)的不斷發(fā)展與成熟[4],人工智能技術(shù)不再是紙上談兵的理論,這對課程的實踐環(huán)節(jié)提出了更高的要求。受學(xué)校實驗室環(huán)境和設(shè)備的限制,綜合性、前沿性實驗難以開展,主要表現(xiàn)在如下3個方面。
(1)實驗內(nèi)容過于簡單,缺乏綜合性實驗。課程實驗往往只注重對知識點的強化,而忽略了其實際應(yīng)用場景。多數(shù)實驗均為演示型、體驗型實驗,無法真正讓學(xué)生領(lǐng)會到實際應(yīng)用中的問題并培養(yǎng)解決問題的能力。如神經(jīng)網(wǎng)絡(luò)實驗中,只能通過演示型實驗讓學(xué)生了解網(wǎng)絡(luò)迭代優(yōu)化的過程,而對較重要的應(yīng)用場景——圖像識別的實驗卻難以支撐。
(2)實驗設(shè)備老舊,無法滿足新技術(shù)要求。學(xué)校的實驗室設(shè)備仍然停留在單臺計算機的水平,且實驗室的設(shè)備只能在學(xué)生實驗期間使用,學(xué)生一旦離開則不能繼續(xù)運行。與此相對應(yīng)的,是以機器學(xué)習(xí)、深度學(xué)習(xí)為代表的主要靠數(shù)據(jù)、算力和算法支撐的新一代人工智能技術(shù)實驗需求,其中很多實驗需要學(xué)生長時間自行訓(xùn)練和學(xué)習(xí)。老舊設(shè)備無法承載大數(shù)據(jù)存儲和高速運算的需求,實驗室管理辦法也沒有跟上新的需求。即便是進行簡單的手寫數(shù)字識別實驗,1臺實驗室的計算機完成1次實驗訓(xùn)練也需要15~30分鐘。
(3)實驗考核困難,難以定量分析。由于條件限制,以往的實驗只能是驗證性實驗,且由于單機的形式,實驗數(shù)據(jù)、實驗環(huán)境難以統(tǒng)一,使得評價指標(biāo)的計算基礎(chǔ)不一致,教師對學(xué)生實驗環(huán)節(jié)的表現(xiàn)多半只能通過實驗報告來評價。這里面摻雜了很多主觀因素。例如,對于回歸分析的實驗,每名學(xué)生1份數(shù)據(jù),每人的機器都有區(qū)別,導(dǎo)致最后只能從擬合程度來判斷實驗效果,而無法對時間性能、空間性能進行更全面的評價。且數(shù)據(jù)量受到單機存儲量限制,只能進行小樣本實驗,無法再現(xiàn)實際工作中可能出現(xiàn)的問題。
2 云實驗的引入與設(shè)計
在高校實驗環(huán)境建設(shè)相對落后的同時,很多科技企業(yè)開始布局人工智能領(lǐng)域[5],并且推出相應(yīng)的云端計算服務(wù)平臺。ModelArts是華為公司面向開發(fā)者提供的云端AI開發(fā)平臺,為機器學(xué)習(xí)與深度學(xué)習(xí)提供海量數(shù)據(jù)預(yù)處理及半自動化標(biāo)注、大規(guī)模分布式訓(xùn)練、自動化模型生成,及端— 邊—云模型按需部署能力,幫助快速創(chuàng)建和部署模型,管理全周期AI工作流。中南大學(xué)于2018年底申請教育部產(chǎn)學(xué)合作協(xié)同育人項目,與華為公司達成協(xié)同育人協(xié)議,將ModelArts引入“人工智能”等相關(guān)課程的實驗教學(xué)中,為課程實驗提供云端算力支持。
2.1 ModelArts應(yīng)用背景
ModelArts是華為公司針對AI開發(fā)者面臨的一系列困難設(shè)計開發(fā)的一站式開發(fā)平臺,所謂 “一站式”是指AI開發(fā)的各環(huán)節(jié),包括數(shù)據(jù)處理、算法開發(fā)、模型訓(xùn)練、模型部署都可以在 ModelArts上完成。從技術(shù)上看,ModelArts底層支持各種異構(gòu)計算資源,開發(fā)者可以根據(jù)需要靈活選擇使用,而不需要考慮底層的技術(shù)。同時, ModelArts支持Tensorflow、PyTorch等主流開源的AI開發(fā)框架,也支持開發(fā)者使用自研的算法框架。面向不同經(jīng)驗的AI開發(fā)者,提供便捷易用的使用流程。例如,面向業(yè)務(wù)開發(fā)者,不需關(guān)注模型或編碼,可使用自動學(xué)習(xí)流程快速構(gòu)建AI 應(yīng)用;面向AI初學(xué)者,不需關(guān)注模型開發(fā),使用預(yù)置算法構(gòu)建AI應(yīng)用;面向AI工程師,提供多種開發(fā)環(huán)境,多種操作流程和模式,方便開發(fā)者編碼擴展,快速構(gòu)建模型及應(yīng)用。對不同層次使用者的支持,正好符合課程實驗中不同需求何難度的實驗要求,非常適合作為實踐教學(xué)平臺。 ModelArts中典型的AI算法訓(xùn)練和發(fā)布流程,如圖1所示。
ModelArts預(yù)置了大量已標(biāo)注數(shù)據(jù)集,可以支持目標(biāo)檢測、目標(biāo)識別等多種任務(wù),還支持用戶上傳自建的數(shù)據(jù)集,并提供了標(biāo)注工具;在算法開發(fā)過程中,Tensorflow、PyTorch等主流框架均已集成進去,并有大量預(yù)置算法模型供使用者選擇使用,有利于快速實現(xiàn)課堂上介紹的各種框架和算法,便于學(xué)生對之建立起感性認(rèn)識;至于訓(xùn)練模型,平臺提供分布式集群進行訓(xùn)練,遠超老舊實驗設(shè)備所能提供的計算資源,大大縮短了訓(xùn)練時間,另外零編程的自動學(xué)習(xí)方式方便課堂演示實驗效果,激發(fā)學(xué)生的學(xué)習(xí)興趣;訓(xùn)練后的模型可以很容易地進行部署,提供預(yù)測推理功能,支持各類應(yīng)用。
2.2 課程實驗安排
“人工智能”課程作為智能科學(xué)與技術(shù)專業(yè)的專業(yè)基礎(chǔ)課,在涉及機器學(xué)習(xí)部分的教學(xué)中主要關(guān)注學(xué)生的基本理論學(xué)習(xí)和應(yīng)用體會。學(xué)生在這部分學(xué)習(xí)中主要需要了解學(xué)習(xí)系統(tǒng)的構(gòu)建過程及可能遇到的各種問題,讓學(xué)生在實驗過程中對技術(shù)的應(yīng)用先有整體認(rèn)識,以便在后續(xù)的“模式識別”“機器學(xué)習(xí)”等課程中更加關(guān)注具體的技術(shù)和方法。結(jié)合ModelArts功能和課程實際情況,課程實驗內(nèi)容設(shè)計如下。
(1)回歸分析。①分析胚胎發(fā)育B超測量數(shù)據(jù),利用ModelArts開發(fā)環(huán)境中的Notebook自編代碼,建立合適的回歸模型,進行胚胎發(fā)育情況的趨勢模型編寫,并對指定測試集的數(shù)據(jù)進行預(yù)測;②前列腺癌預(yù)測,利用ModelArts開發(fā)環(huán)境中的Notebook自編代碼,對前列腺癌數(shù)據(jù)進行回歸分析,統(tǒng)一測試集進行測試。
(2)手寫數(shù)字識別。①利用ModelArts上的 Minist手寫數(shù)字集,訓(xùn)練和測試手寫數(shù)字識別; ②將回歸模型稍加修改,遷移到美國郵政編碼手寫數(shù)字集的數(shù)字識別上,檢測識別率并進行改進。
(3)找校徽。請學(xué)生搜集校園中各處出現(xiàn)的中南大學(xué)校徽圖片,統(tǒng)一形成數(shù)據(jù)集上傳ModelArts,利用平臺標(biāo)注工具為數(shù)據(jù)進行標(biāo)注,仿照云平臺中的“找云寶”實驗,完成找校徽實驗。實驗的設(shè)計從易到難,先完成線上編程,再完成從數(shù)據(jù)到應(yīng)用的完整實驗流程,讓學(xué)生在實踐過程中不斷提高解決問題的能力。實驗以分組形式完成,每名學(xué)生均需完成所有實驗內(nèi)容,但可取最好的實驗結(jié)果作為本組的最后成績。實驗完成后組織集體匯報,學(xué)生以組為單位匯報實驗內(nèi)容與結(jié)果,同時統(tǒng)計每組最終成績,公布排行榜。每名學(xué)生在每個實驗部分的得分按照其個人在組內(nèi)排名和整組排名綜合計算。
3 云實驗教學(xué)特色
(1)課堂教學(xué)手段更加豐富。以往受制于計算資源,課堂上的案例都只能給出過程描述和結(jié)果截圖,引入云端資源后,即便是在教室的機器上,也可以通過實操來向?qū)W生展示教學(xué)案例的實現(xiàn)過程,使其對其中的問題和解決辦法有更直觀的認(rèn)識。
(2)實驗安排更加靈活。專業(yè)課的授課學(xué)生普遍較少,其中的實驗學(xué)時就更少了。以往2學(xué)時實驗的安排及集中在實驗室進行的方式都使得大規(guī)模綜合性實驗難以開展。云實驗的出現(xiàn),使學(xué)生可以不受空間和時間的限制,同時擴大了實驗內(nèi)容的范圍。
(3)學(xué)生學(xué)習(xí)更加主動。隨著實驗內(nèi)容綜合性、實用性的提高,學(xué)生完成實驗的熱情也逐漸提高。演示型、體驗型實驗學(xué)生只能被動參與,云實驗由于只限定了輸入、輸出及基本辦法,具體的處理過程和方法細節(jié)都可以由學(xué)生設(shè)計,臺可為培養(yǎng)大數(shù)據(jù)應(yīng)用型人才提供重要保障,滿足師生多元化與多終端的需求。
2023-2024JCR影响因子
SCI 论文选刊、投稿、修回全指南
SSCI社会科学期刊投稿资讯
中外文核心期刊介绍与投稿指南
sci和ssci双收录期刊
EI收录的中国期刊
各学科ssci
各学科sci
各学科ahci
EI期刊CPXSourceList
历届cssci核心期刊汇总
历届cscd-中国科学引文数据库来源期刊
CSCD(2023-2024)
中科院分区表2023
中国科技核心期刊历届目录
2023年版中国科技核心期刊目录(自然科学)
2023年版中国科技核心期刊目录(社会科学)
历届北大核心
2023版第十版中文核心目录
2023-2024JCR影响因子
SCI 论文选刊、投稿、修回全指南
SSCI社会科学期刊投稿资讯
中外文核心期刊介绍与投稿指南
sci和ssci双收录期刊
EI收录的中国期刊
各学科ssci
各学科sci
各学科ahci
EI期刊CPXSourceList
历届cssci核心期刊汇总
历届cscd-中国科学引文数据库来源期刊
CSCD(2023-2024)
中科院分区表2023
中国科技核心期刊历届目录
2023年版中国科技核心期刊目录(自然科学)
2023年版中国科技核心期刊目录(社会科学)
历届北大核心
2023版第十版中文核心目录
論文指導(dǎo) >
SCI期刊推薦 >
論文常見問題 >
SCI常見問題 >
请填写信息,出书/专利/国内外/中英文/全学科期刊推荐与发表指导