燃文中文

第58頁 (第2/2页)

天才一秒记住【燃文中文】地址:www.ranwenzw.cc

回到了原來時空的工作狀態。

跟專家的會議時間定在半個月後,有意向的投資人和股東都會到場,會議的核心主題將決定人工智慧未來的研究發展發向,是繼續研究語法樹,還是興起不久的深度學習研究。

秘書的事務已無暇顧及,何謹修倒沒說什麼,讓hr再借調一個人手過來。

韓念初幾乎都泡在實驗室里,跟周嚴果討論,寫代碼,劉銘親自坐鎮,也要了張辦公桌,和他們一起辦公。

周嚴果站在白板前說:「在現有語料庫的基礎上,假設我們把狀態價值函數和動作價值函數定義好,加入現有的代碼模塊,實現有監督的學習。」

劉銘問:「具體怎麼實現?」

周嚴果說:「這就是今天討論的目的,集思廣益,討論出這個方法的可行性。」

何謹修捏著筆,不知為何,他的目光轉向了韓念初。

韓念初走到周嚴果旁邊,接過他的筆,在白板上寫滿了公式,轉身說道:「用貝爾曼方程疊代計算獎懲。」

眾人一愣。

韓念初接著說道:「具體一點,先定義狀態價值函數,用來評估狀態優劣。行為或動作價值函數用於評估下一個字或詞的優劣。完成定義後,進一步定義出累計獎勵函數,就可以評價出一整句回答的優劣。」

「獎勵函數怎麼定義?這個函數接受的變量怎麼從人傳給機器?這個變量給了函數以後,函數怎麼去調整它的輸出?答好要加多少分?答不好要扣多少分?那個獎勵函數怎麼解?」周嚴果一口氣問出了一連串的問題。

韓念初在白板上一邊劃線一邊講解:「想想公式怎麼定義,根據公式把獎懲機制加進原始碼,測試一下就行了。我說明白了嗎?」

</br>

<style type="text/css">

banners6 { width: 300px; height: 250px; }

dia (-width:350px) { banners6 { width: 336px; height: 280px; } }

dia (-width:500px) { banners6 { width: 468px; height: 60px; } }

dia (-width:800px) { banners6 { width: 728px; height: 90px; } }

dia (-width:1280px) { banners6 { width: 970px; height: 250px; } }

</style>

<s class="adsbygoogle banners6" style="display:le-block;" data-full-width-responsive="true" data-ad-client="ca-pub-4468775695592057" data-ad-slot="8853713424"></s>

</br>

</br>

如遇章节错误,请点击报错(无需登陆)

新书推荐

重生不負/重返20歲 粟宝苏意深小说全文免费阅读 天落鸟(1v3) 我的外挂叫地球 花娇 杀手情人 宠你上天