• 讀書網|DuShu.com - 讀書·學習·生活
  •  | 簡體版
  • 論壇
  • 暢銷
  • 連載
  • 圖書
  • 資訊
  • 首頁
  • 國學/古籍 | 文學藝術 | 人文社科 | 經濟管理 | 生活時尚 | 科學技術 | 教材教輔 | 少兒讀物
  •    
  • 圖書搜索:
  •  
     全部圖書 可讀圖書 可購圖書
     
  • 分層強化學習理論與方法 - 書籍詳細信息
  • 查看同類圖書:教育/教材/教輔»教材»研究生/本科/專科教材»分層強化學習理論與方法
  • 分層強化學習理論與方法

  • 【作 者】:沈晶 編著
  • 【叢編項】:
  • 【裝幀項】:平裝 16開 / 141
  • 【出版項】:哈爾濱工業大學出版社 / 2007-12-1
  • 【ISBN號】:9787811330281 / 7811330288
  • 【原書定價】:¥19.00 有1家書店打折銷售 
  • 【主題詞】:計算機/網絡-人工智能
  • 【圖書簡介】
      強化學習通過試錯與環境交互獲得策略的改進,其自學習和在線學習的特點使其成為機器學習研究的一個重要分支。但是,強化學習一直被維數災難所困擾,近年來,分層強化學習在克服維數災難方面取得了顯著進展。本書系統地介紹了強化學習、分層強化學習的理論基礎和學習算法以及作者在分層強化學習領域的研究成果和該領域的最新研究進展。 本書可作為高等院校和科研機構從事計算機應用、人工智能和機器學習等相關專業和方向的教師、研究人員、研究生及高年級本科生參考使用。
  • 【作者簡介】
      第1章緒論分層強化學習是在強化學習的基礎上通過增加“抽象機制”而形成的一種效率更高的機器學習方法。本章將對機器學習、強化學習、分層強化學習的定義以及研究現狀進行介紹。1.1機器學習1.1.1 機器學習的定義機器學習(Machine Learning)的核心是學習。學習是人類具有的一種重要智能行為,但究竟什么是學習,長期以來卻眾說紛紜。這是因為進行這一研究的人們分別來自不同的學科,更重要的是學習是一種多側面、綜合性的心理活動,它與記憶、思維、知覺、感覺等多種心理行為都有著密切的聯系,人們難以把握學習的機理與實現。社會學家、邏輯學家和心理學家都各有其不同的看法。按照人工智能大師Simon的觀點,學習就是系統在不斷重復的工作中對本身能力的增強或者改進,使得系統在下一次執行同樣任務或類似任務時,會比現在做得更好或效率更高。這一闡述包含過程、系統與改進性能這樣三個要點。學習的基本模型就是基于這一觀點建立起來的。機器學習至今還沒有統一的定義,而且也很難得到一個公認的和準確的定義。顧名思義,機器學習是研究如何使用機器來模擬人類學習活動的一門學科。稍微嚴格的提法:機器學習是一門研究機器獲取新知識和新技能,并識別現有知識的學問。
  • 【本書目錄】
    第1章 緒論
     1.1 機器學習
      1.1.1 機器學習的定義
      1.1.2 機器學習的發展史
      1.1.3 機器學習系統的基本模型
      1.1.4 機器學習的主要策略
    1.2 強化學習
      1.2.1 強化學習的定義
      1.2.2 強化學習的發展史
     1.3 分層強化學習
      1.3.1 分層強化學習的定義
      1.3.2 研究現狀與發展趨勢
    第2章 強化學習
     2.1 強化學習的基本原理
     2.2 強化學習的基本方法
     2.3 部分可觀測馬氏過程
    第3章 分層強化學習
     3.1 半馬氏過程
    3.2 分層與抽象
    3.3 典型分層強化學習方法
      3.3.1 Option分層強化學習方法
      3.3.2 HAM分層強化學習方法
      3.3.3 MAXQ分層強化學習方法
      3.3.4 典型分層強化學習方法的比較分析
     3.4 OMQ分層強化學習方法
      3.4.1 測試用例描述
      3.4.2 OMQ理論框架
      3.4.3 OMQ學習算法
      3.4.4 OMQ學習算法最優性分析
      3.4.5 OMQ學習算法收斂性證明
      3.4.6 OMQ學習算法實驗分析
    第4章 動態分層強化學習
     4.1 學習任務的自動分層
      4.1.1 瓶頸和路標狀態法
      4.1.2 共用子空間法
      4.1.3 多維狀態法
      4.1.4 馬氏空間法
      4.1.5 其他有關方法
      4.1.6 任務自動分層方法評價
     4.2 基于免疫聚類的自動分層算法
      4.2.1 免疫原理剖析
      4.2.2 基于免疫聚類的Option自動生成算法
     4.3 基于二次應答機制的動態分層算法
      4.3.1 算法描述
      4.3.2 實驗分析
     4.4 未知動態環境中的分層強化學習方法
      4.4.1 移動機器人路徑規劃問題
      4.4.2 未知動態環境中的OMQ分層強化學習算法
      4.4.3 實驗分析
     ……
    第5章 多智能體分層強化學習
    參考文獻
  • 【購買本書】
  • 商城名稱價格 配送信息優惠活動去看看購買

    當當網
    ¥14.30
    當天加急送:北京五環以內
    送貨上門:國內178個城市
    郵寄:全球
    特快專遞:全球
    特惠商品68折封頂 去看看 訂購
  • 說明:
  • 1、由于網上書店可能根據各種情況隨時調整價格,我們的價格信息存在滯后性。以上價格僅作參考,具體以網上書店標示的價格為準。
    2、如價格折扣信息和原書定價存在較大誤差,可能是該店售書為本書的不同版本或不同裝禎形式,請讀者自行鑒別。
    3、對如何網上購書存在疑問,請點擊上面購書指南鏈接查詢。
  • Copyright © 讀書網 www.dushu.com 2006-2007, All Rights Reserved.
    鄂ICP備06000781號 公安備4201502577