国产成人毛片视频|星空传媒久草视频|欧美激情草久视频|久久久久女女|久操超碰在线播放|亚洲强奸一区二区|五月天丁香社区在线|色婷婷成人丁香网|午夜欧美6666|纯肉无码91视频

阿爾法圍棋 阿爾法圍棋程序的工作原理?

阿爾法圍棋程序工作原理?AlphaGo是一個(gè)圍棋人工智能程序。這個(gè)程序用“價(jià)值網(wǎng)絡(luò)”來計(jì)算形勢,用“策略網(wǎng)絡(luò)”來選擇下一步。阿爾法圍棋程序的工作原理?AlphaGo是一個(gè)圍棋人工智能程序。這個(gè)程序用“

阿爾法圍棋 阿爾法圍棋程序的工作原理?

阿爾法圍棋程序工作原理?

AlphaGo是一個(gè)圍棋人工智能程序。這個(gè)程序用“價(jià)值網(wǎng)絡(luò)”來計(jì)算形勢,用“策略網(wǎng)絡(luò)”來選擇下一步。

阿爾法圍棋程序的工作原理?

AlphaGo是一個(gè)圍棋人工智能程序。這個(gè)程序用“價(jià)值網(wǎng)絡(luò)”來計(jì)算形勢,用“策略網(wǎng)絡(luò)”來選擇下一步。圍棋(AlphaGo)就是通過兩個(gè)不同的神經(jīng)網(wǎng)絡(luò)“大腦”的合作來提高下棋水平。這些大腦是多層神經(jīng)網(wǎng)絡(luò),結(jié)構(gòu)類似于谷歌圖像搜索引擎識(shí)別的那些圖像。他們從多層啟發(fā)式二維過濾器入手,處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖片一樣。過濾后,13個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層對他們看到的東西產(chǎn)生判斷。這些層可以進(jìn)行分類和邏輯推理。

這些網(wǎng)絡(luò)通過反復(fù)訓(xùn)練來檢查結(jié)果,然后校對調(diào)整參數(shù),使接下來的執(zhí)行更好。這個(gè)處理器有很多隨機(jī)元素,所以人們不可能確切知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練可以讓它進(jìn)化到更好。

第一個(gè)大腦:移動(dòng)選擇器

AlphaGo的第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)”。觀察棋盤的布局試圖找到最好的下一步。事實(shí)上,它預(yù)測了每一個(gè)合法的下一步的最佳概率,所以第一個(gè)猜測是概率最高的一個(gè)。這可以理解為“下拉選擇器”。

第二個(gè)大腦:位置評估者

AlphaGo (AlphaGo)的第二大腦回答的是另一個(gè)相對于下拉選擇器的問題。它不是猜測具體的下一步,而是預(yù)測每個(gè)棋手贏棋的可能性,然后給出棋子的位置。這個(gè)“形勢評估器”就是“價(jià)值網(wǎng)”,通過判斷全局來輔助后選人。這個(gè)判斷只是大概,但是對提高閱讀速度很有幫助。通過對“好”和“壞”的潛在未來情況進(jìn)行分類,AlphaGo可以決定是否通過特殊的變體進(jìn)行深度閱讀。如果情況評估者說這個(gè)特殊的變體不好,那么AI將跳過閱讀這條線上的任何更多移動(dòng)。