首頁 名人專欄 部落客專欄

AI 育兒筆記(六):用AI大數據挑選故事

身為AI時代的科技人,帥爸決定用自己的專業,來過濾篩選好故事。不論故事是網路找的、自己寫的,還是繪本出處的,都先用以下步驟,加以分析過濾。
1. 詞彙量分析
2. 詞性分析
3. 句法分析
4. 情緒分析

長年從事人工智慧自然語言(NLP)的工作,我發現孩子在學習語言的過程跟訓練電腦很像,或者反過來講,其實是科學家在觀察了孩子學習語言過程後,將之轉換成人工智慧演算法,而電腦是由大數據採集開始,孩子則是從聽故事開始的。

 

孩子藉由聽故事來了解故事的內容,引用清大幼教系周育如主任的觀點,可拆解為五個步驟:1. 文字的解碼 2. 語意的提取 3. 知識的提取 4. 邏輯的處理 5. 情緒的投入

聽故事的時候,孩子會對故事裡的文字或熟悉的詞彙進行一些解析,提取他可能理解的語意,接著把當中好奇與陌生的部分記住,並進行一些處理、分離。他會將最重要的詞彙記憶起來,在這過程中會運用上天賦予給他的第六感,進而明確感知其中的情緒,尤其會對有危險的情緒表現感覺更為強烈,這也是為何孩子對於危險訊息的察覺往往比成人靈敏許多。

 

除了上述的五部曲外,我認為故事的「正向情緒」感染力也是很重要的一部分。

 

身為AI時代的科技人,帥爸決定用自己的專業,來過濾篩選好故事。不論故事是網路找的、自己寫的,還是繪本出處的,都先用以下步驟,加以分析過濾。

  1. 詞彙量分析
  2. 詞性分析
  3. 句法分析
  4. 情緒分析

 

詞彙量分析

將故事文稿進行「斷句斷詞」的處理,藉此將故事中的詞彙提取出來。類似的工具,網路上有很多開源碼可以利用,例如,結巴分詞等......都可以解決中文分詞的問題。分詞過後,我們就能得知故事的詞彙數量,再將拆解出來的詞彙放入3~5歲適合的詞彙庫中進行篩選,太艱澀的詞彙此時會被挑選出來,但整篇故事我還是容許可出現5個以內的新詞彙,這些詞彙可以用來教導孩子新的用詞。

 

每篇故事的詞彙數量到手之後,就可按照自己想要教給寶貝的進度,先作一個系統規劃,按照寶貝能吸取的進度,扣除複習的時間,然後自己排出一套學習小目標,重複一些不常用的詞彙,減去一大批常用詞彙、家中常用詞彙等等......

 

當然,這年紀的寶貝其實很聰明,常常一學就會,不必「考試」來檢測他們的吸收量。根據我家帥帥的經驗,寶貝能快速吸取詞彙,然後很快拿來用,啼笑皆非的嘗試他所學到的詞彙,這是因為寶貝能夠用大人理解的方式把句子講出來,他自己也會很有成就感!成就感是人類存在與進步的重要動力。

 

寶貝感覺他能表達自己的意思,而且大人也能聽懂,那種成就感是非常自豪的。寶貝就會開始不亂哭或耍賴,因為他開始會運用人類文明的工具「溝通」,這是作為爸爸媽媽非常值得高興的一個里程碑。

 

當然,也需要對故事的情緒作一些分析,我認為,這比吸收詞彙還重要!聖經中反覆提到要說「造就人的話語」,佛教大師們也都常告誡「說好話」的影響,除了本身的意思,還有一些心理上或形而上主義、靈魂上的影響,這影響非常巨大! 據說連植物也能被話語影響,話語無非就是詞彙,也就是故事中用到的詞語,那當然要來弄清楚。

詞性分析

將詞彙進行詞性分析。

用圖表來說明,會很清楚,這張表把詞彙進行了詞性分析, 這是AI判讀很重要的步驟,想像一下,AI機器人會在這個階段將各詞彙進行拆解與組合。只要斷詞正確,就能分析每個詞的詞性,AI理解詞性後,AI就能「讀懂」 故事到底在講什麼!

 

句法分析

故事的陳述句要盡量符合孩子可理解的方式,例如,這段話「老虎覺得很有自信,他認為自己的武功最厲害,任何小動物都比不上他」就不會寫成「老虎自視甚高,認為自己的拳法攻無不克,任何小動物都無法匹敵」。孩子版與大人版的差別這樣一比較就秒懂了。

 

在分析的過程當中,發現有孩子無法理解的敘述句時,就會改成孩子能理解的版本。

 

情緒分析

這是參考了著名學者,David Hawkins的情緒振動頻率理論,簡單來說,他認為人類的情緒都有相對應的能量產出,我將他的人類能量等級修改成15個等級(可以參考下表)變身成「故事情緒等級表」。再將故事中出現的情緒用語輔以這張表加以對照,正向的詞彙為加項,負向詞彙為減項,最後會得出一個故事情緒總分,當故事情緒總分出現負分時,我會對故事內容進行修改,目標是讓整個故事趨向正向情緒,讓孩子聽好、聽滿、不會傷心難過覺得冷。

範例:快樂王子有點傷心(-80),因為在不遠的閣樓裡,住著一位優秀(+80)的作家。他家徒四壁,很久沒有好好的吃一頓飯,所以,他的頭髮像稻草一樣乾燥,身體瘦得跟紙片一樣,但只要談到寫作,一雙眼睛便張得很大,相當有精神:這個年輕作家,正在完成一本偉大的書。燕子知道後,問快樂王子說:這麼努力(+50)的年輕人,要不要送一顆紅寶石給他呢?

上面這小段落經由故事情緒分析計算後,得分為50分。

註:對此議題有興趣的人可參考David Hawkins大師的著作, Power VS. Force: The Hidden Determinants of Human Behavior

 

當然,也許有爸爸媽媽會問,「情緒分析過後的正向故事,都適合給孩子聽嗎?」

 

這個問題很好!

 

每篇故事所得到的情緒分數還得再經過比較、排序,排序較前面,正向情緒分數高的故事,才會正式啟動錄音工作,在夜深人靜的晚上,對著麥克風錄音,製作給寶貝聽。

 

經過這一連串浩大工程所作出來的故事,爸爸媽媽們是否覺得,相較以前隨意在網路上找來給孩子聽的故事,安心一點點。帥爸講的故事,放在這裡,歡迎有需要的家長聆聽使用。

 

最終科技能做的有限,在「陪伴」這一環,還是得由爸爸媽媽們親自操刀才行喔!

 


本文章轉載自《帥爸兒童程式教育園地》部落格