U体育 | 最新更新
您的当前位置:首页 > 亚洲杯 > 正文

DeepMind鍥炲簲锛欰lphaStar涓ょ櫨骞寸浉褰撲簬浜虹被澶氫箙锛焈妫嬬墝

来源:usportnews 编辑:U体育 所属栏目:亚洲杯 时间:2019-02-05 18:17:20
本文由亚洲杯2019年02月05日转载报道: DeepMind棣栧腑鐮旂┒鍛楧avid Silver DeepMind棣栧腑鐮旂┒鍛楧avid Silver

銆€銆€鏂囩珷鏉ユ簮锛氭柊鏅哄厓鍏紬鍙?nbsp;

銆€銆€鏉ユ簮锛歊eddit

銆€銆€缂栬緫锛氬皬鑺?鍏冨瓙

銆€銆€[鏂版櫤鍏冨璇籡鏄ㄥぉDeepMind鐨凙lphaStar妯壂鏄熼檯2鑱屼笟鐜╁锛岄」鐩礋璐d汉Oriol Vinyals鍜孌avid Silver涓や綅鎶€鏈ぇ鐗涗翰鑷瓟缃戝弸鎻愰棶銆傛柊鏅哄厓鎽橀€夌偣璧炴渶楂樼殑15涓棶棰橈紝鍏充簬APM銆佺畻娉曞拰宸ョ▼鐨勭簿鍗庛€?/p>

銆€銆€鈥淎I鏃╂櫄浼氳秴瓒婁汉绫烩€濈殑蹇靛ご锛屽叾瀹炰粠AlphaGo寮€濮嬶紝灏卞凡缁忓湪姣忎釜浜哄績搴曪紝鎮勬倓钄撳欢寮€銆?/p>

銆€銆€鍙笉杩囨垜浠瘡涓汉蹇冮噷杩樻槸寰堜笉鐢樺績锛侀潰瀵规櫤鍔涚敋鑷虫棤娉曡揪鍒颁汉绫诲┐鍎挎按骞崇殑AI锛岀帺璧锋父鎴忔潵锛屽凡缁忔病浜鸿兘鎵撳緱杩囦簡銆?/p>

銆€銆€AlphaStar鍙栬儨闈犵殑APM銆佽绠楁満澶氱嚎鎿嶄綔锛岃繕鏄疉I宸茬粡鏈変簡鎴樻湳鍒ゆ柇銆佸畯瑙傚ぇ灞€鍒嗘瀽鑳藉姏锛?/p>

銆€銆€璧涘悗锛孌eepMind瀹樻柟鍦≧eddit涓婏紝鍥炲浜嗙綉鍙嬪叧浜嶢lphaStar鐨勭绉嶇枒闂€?/p>

銆€銆€姝ゆ娲惧嚭鐨勬槸Oriol Vinyals鍜孌avid Silver銆?/p>

銆€銆€Oriol Vinyals 鏄?Google 鏃椾笅浜哄伐鏅鸿兘鍏徃 DeepMind 鐨勭爺绌剁瀛﹀锛屽勾灏戞椂锛屼粬鏇炬槸瑗跨彮鐗欍€婃槦闄呬簤闇搞€嬫父鎴忔帓鍚嶇涓€鐨勭數绔為珮鎵嬶紝鍚屾椂鍙備笌 Gmail銆丟oogle 鍥惧儚璇嗗埆鏈嶅姟寮€鍙戙€?/p>

銆€銆€David Silver鏄疍eepMind棣栧腑鐮旂┒鍛橈紝甯﹂DeepMind寮哄寲瀛︿範鐮旂┒灏忕粍锛屼篃鏄疉lphaGo椤圭洰鐨勮礋璐d汉銆傚彲浠ヨ锛孲ilver浠嶢lphaGo璇炵敓鍓嶈捣锛屽埌鏈€寮虹増鏈珹lphaGo Zero锛屼竴鐩村湪鐢ㄦ繁搴﹀己鍖栧涔犳敾鍏嬪洿妫嬨€侱avid Silver涔熸槸AlphaStar椤圭洰鐨勮仈鍚堣礋璐d汉銆?/p>

銆€銆€AlphaStar鑾疯儨闈犵殑鏄疉PM鍚楋紵

銆€銆€闂細APM鏄€庝箞鍥炰簨锛熸垜鍗拌薄涓槸琚玈C2闄愬埗涓?80 WPM锛屼絾鐪嬭棰戯紝AS鐨勫钩鍧嘇PM浼间箮寰堥暱涓€娈垫椂闂撮兘杩滆繙瓒呰繃浜?80 WPM锛岃€屼笖DeepMind鐨勫崥瀹㈡枃绔犻噷鎻愬埌浜嗕笂闈㈢殑鍥捐〃鍜屾暟瀛楋紝浣嗘病鏈夎В閲婁负浠€涔圓PM杩欎箞楂樸€?/p>

銆€銆€Oriol Vinyals锛氭垜璁や负杩欐槸涓€涓緢濂界殑闂锛屼篃鏄垜浠兂瑕佹緞娓呯殑銆?/p>

銆€銆€鎴戜滑鍚慣LO鍜屾毚闆挩璇簡鍏充簬APM鐨勯棶棰橈紝涔熷APM澧炲姞浜嗕竴涓‖鎬ч檺鍒躲€傜壒鍒槸锛屾垜浠缃簡5绉掑唴鏈€澶?00 APM锛?15绉掑唴鏈€澶?00 APM锛?30绉掑唴鏈€澶?20 APM锛?60绉掑唴鏈€澶?00 APM銆?/p>

銆€銆€濡傛灉鏅鸿兘浣撳湪姝ゆ湡闂村彂鍑烘洿澶氭搷浣滐紝鎴戜滑浼氬垹闄?蹇界暐杩欎簺鎿嶄綔銆傝繖浜涙槸鏉ヨ嚜浜虹被缁熻鐨勬暟鎹€?/p>

銆€銆€鍚屾牱閲嶈鐨勬槸锛屾毚闆湪APM璁$畻涓娆¤绠楁煇浜涘姩浣滐紙涓婇潰鐨勬暟瀛楁槸鎸囨潵鑷猵ysc2涓殑鈥滀唬鐞嗗姩浣溾€濓級銆?/p>

銆€銆€鍚屾椂锛屾垜浠殑鏅鸿兘浣撲娇鐢ㄦā浠垮涔狅紝杩欐剰鍛崇潃鎴戜滑缁忓父浼氱湅鍒伴潪甯糕€滃瀮鍦锯€濈殑琛屼负銆備篃灏辨槸璇达紝骞朵笉鏄墍鏈夌殑鎿嶄綔閮芥槸鏈夋晥鐨勬搷浣滐紝鍥犱负浠g悊鍊惧悜浜庡彂閫佺碂绯曠殑鈥滅Щ鍔ㄢ€濆懡浠わ紝渚嬪鍦ㄥ懆鍥寸粫鏉ョ粫鍘汇€?/p>

銆€銆€鏈変汉宸茬粡鍦╮eddit鐨勫笘瀛愪腑鎸囧嚭浜嗚繖涓€鐐光€斺€擜lphaStar鐨勬湁鏁圓PM 锛堟垨EPM锛?瑕佷綆寰楀銆?/p>

銆€銆€AlphaStar涓€鍏辨湁鍑犱釜鐗堟湰锛?/p>

銆€銆€闂細鍦≒BT涓渶瑕佸灏戠涓嶅悓鐨刟gent鎵嶈兘淇濇寔瓒冲鐨勫鏍锋€э紝浠ラ槻姝㈢伨闅炬€ч仐蹇橈紵杩欎笌agent鐨勬暟閲忔湁澶氬ぇ鍏崇郴锛屾垨鑰呭彧闇€瑕佸嚑涓猘gent灏卞彲浠ヤ繚鎸侀瞾妫掓€э紵鏈夋病鏈変笌姣旇緝甯哥敤鐨勫巻鍙叉鏌ョ偣绛栫暐鐨勬晥鐜囪繘琛屾瘮杈冿紵

銆€銆€David Silver锛氭垜浠繚鐣欐瘡涓猘gent鐨勬棫鐗堟湰浣滀负AlphaStar鑱旇禌鐨勭珵浜夊鎵嬨€?/p>

銆€銆€褰撳墠鐨刟gent閫氬父鏍规嵁瀵规墜鐨勮儨鐜囨潵鎵撱€傝繖鍦ㄩ槻姝㈢伨闅炬€ч仐蹇樻柟闈㈡槸闈炲父鎴愬姛鐨勶紝鍥犱负agent蹇呴』瑕佽兘澶熺户缁墦璐ュ畠涔嬪墠鐨勬墍鏈夌増鏈€?/p>

銆€銆€鎴戜滑灏濊瘯浜嗚澶氬叾浠栫殑澶氭櫤鑳戒綋瀛︿範绛栫暐锛屽彂鐜拌繖绉嶆柟娉曢潪甯告湁鏁堛€傛澶栵紝澧炲姞AlphaStar鑱旇禌鐨勫鏍锋€т篃寰堥噸瑕侊紝灏界杩欏疄闄呬笂鏄伨闅炬€ч仐蹇樼殑鍙︿竴涓柟闈€?/p>

銆€銆€寰堥毦缁欏嚭鍑嗙‘鐨勬暟瀛楋紝浣嗘垜浠殑缁忛獙鏄紝涓板瘜鑱旂洘涓殑鎴樼暐绌洪棿鏈夊姪浜庝娇鏈€缁堢殑鏅鸿兘浣撴洿寮哄ぇ銆?/p>

銆€銆€AlphaStar鐨勫叧閿畻娉曟槸浠€涔堬紵

銆€銆€闂細鍍廇lphaGo鍜孉lphaZero杩欐牱鐨刟gent鎺ュ彈鐨勬槸瀹岀編淇℃伅鐨勫崥寮堣缁冦€傚儚鏄熼檯浜夐湼杩欐牱鐨勪笉瀹岀編淇℃伅鐨勫崥寮堝浣曞奖鍝峚gent鐨勮璁★紵AlphaStar瀵逛箣鍓嶇殑瑙傚療鏄惁鏈夌被浼间簬浜虹被鐨勨€滆蹇嗏€濓紵

銆€銆€David Silver锛氭湁瓒g殑鏄紝鍩轰簬鎼滅储鐨勬柟娉曪紝渚嬪AlphaGo鍜孉lphaZero锛屽疄闄呬笂鍙兘鏇撮毦閫傚簲涓嶅畬缇庣殑淇℃伅銆備緥濡傦紝鍩轰簬鎼滅储鐨勬墤鍏嬬畻娉?锛堜緥濡侱eepStack鎴朙ibratus锛?閫氳繃belief states鏄惧紡鍦版帹鐞嗗鎵嬬殑鐗屻€?/p>

銆€銆€浣咥lphaStar鏄竴涓猰odel-free鐨勫己鍖栧涔犵畻娉曪紝鍙互闅愬紡鍦板瀵规墜杩涜鎺ㄧ悊锛屽嵆閫氳繃瀛︿範瀵瑰叾瀵规墜鏈€鏈夋晥鐨勮涓猴紝鑰屼笉鏄瘯鍥惧缓绔嬩竴涓鎵嬪疄闄呯湅鍒扮殑妯″瀷鈥斺€斿彲浠ヨ锛岃繖鏄竴绉嶆洿瀹规槗澶勭悊涓嶅畬鍏ㄤ俊鎭殑鏂规硶銆?/p>

銆€銆€姝ゅ锛屼笉瀹岀編鐨勪俊鎭崥寮堝苟娌℃湁涓€绉嶇粷瀵规渶浼樼殑鍗氬紙鏂瑰紡鈥斺€旇繖鍙栧喅浜庡鎵嬬殑琛屼负銆傝繖灏辨槸銆婃槦闄呬簤闇搞€嬩腑鏈夎叮鐨勨€滅煶澶村壀鍒€甯冣€濆姩鎬佺殑鏉ユ簮銆?/p>

銆€銆€杩欐槸鎴戜滑鍦ˋlphaStar鑱旇禌涓娇鐢ㄧ殑鏂规硶鑳屽悗鐨勫姩鏈猴紝浠ュ強涓轰粈涔堣繖绉嶆柟娉曞浜庤鐩栨墍鏈夋垬鐣ョ┖闂村緢閲嶈鈥斺€旇繖鍦ㄥ洿妫嬩箣绫荤殑娓告垙鏄笉闇€瑕佺殑锛屽叾涓湁涓€涓猰inimax鐨勬渶浼樼瓥鐣ュ彲浠ュ嚮璐ユ墍鏈夊鎵嬶紝涓嶇瀵规墜鍋氬嚭浣曠涓惧姩銆?/p>

銆€銆€AlphaStar鏈変娇鐢ㄤ汉绫讳俊鎭紝杩樻槸鍏ㄩ潬鑷垜瀵瑰紙锛?/p>

銆€銆€闂細浣犱滑杩樺皾璇曚簡浠€涔堝叾浠栨柟娉曞悧锛熷ぇ瀹堕潪甯稿ソ濂囨槸鍚︽秹鍙婁换浣曟爲鎼滅储銆佹繁搴︾幆澧冩ā鍨嬫垨鍒嗗眰RL鎶€鏈紝浣嗕技涔庢病鏈変竴涓秹鍙婏紱杩欎簺鏂规硶涓湁閭d釜鍦ㄥ皾璇曞悗鍙栧緱浜嗗彲瑙傜殑杩涙鍚楋紵

銆€銆€瀛愰棶棰橈細閴翠簬SC2鐨勬瀬绔█鐤忔€э紝浣犲浜庡崟绾痵elf-play鏄惁瀵筍C2鏈夋晥杩欎竴鐐规湁浠€涔堢湅娉曪紵OA5鍦ㄦ病鏈変换浣曟ā浠垮涔犳垨棰嗗煙鐭ヨ瘑鐨勬儏鍐典笅灏辨垚鍔熷湴鎵撹触浜咲oTA2锛屾墍浠ヤ粎浠呮槸鎷ユ湁宸ㄥぇ鍔ㄤ綔绌洪棿鐨勯暱娓告垙骞朵笉鑳借鏄巗elf-play灏变笉鑳芥垚鍔熴€?/p>

銆€銆€David Silver锛氭垜浠湪self-play鏂归潰纭疄鍙栧緱浜嗕竴浜涘垵姝ョ殑绉瀬鎴愭灉锛屼簨瀹炰笂锛屾垜浠殑agent鐨勬棭鏈熺増鏈畬鍏ㄩ€氳繃self-play锛屼娇鐢ㄥ熀鏈瓥鐣ュ氨鍑昏触浜嗗唴缃殑bot銆?/p>

銆€銆€浣嗘槸锛屾湁鐩戠潱鐨勪汉绫绘暟鎹寮曞鎺㈢储杩囩▼闈炲父鏈夊府鍔╋紝骞舵湁鍔╀簬鏇村箍娉涘湴瑕嗙洊楂樼骇绛栫暐銆?/p>

銆€銆€鐗瑰埆鏄紝鎴戜滑鍖呭惈浜嗕竴涓猵olicy distillation cost锛屼互纭繚鍦ㄦ暣涓缁冭繃绋嬩腑锛宎gent浠ユ煇绉嶆鐜囩户缁皾璇曠被浼间汉鐨勮涓猴紝杩欒窡浠巗elf-play寮€濮嬬浉姣旓紝鍙戠幇涓嶅お鍙兘鐨勭瓥鐣ヨ鏇村鏄撱€?/p>

銆€銆€杩勪粖涓烘鏈€鏈夋晥鐨勬柟娉曟病鏈変娇鐢ㄦ爲鎼滅储銆佺幆澧冩ā鍨嬫垨鏄惧紡HRL銆傚綋鐒讹紝杩欎簺閮芥槸寰堝ぇ鐨勫紑鏀剧爺绌堕鍩燂紝涓嶅彲鑳界郴缁熷湴灏濊瘯鎵€鏈夊彲鑳界殑鐮旂┒鏂瑰悜锛岃€屼笖杩欎簺棰嗗煙寰堝彲鑳戒负鏈潵鐨勭爺绌跺甫鏉ヤ赴纭曠殑鎴愭灉銆?/p>

銆€銆€闇€瑕佹彁涓€涓嬬殑鏄紝鎴戜滑鐨勭爺绌朵腑鏈変竴浜涘彲鑳借璁や负鏄€渉ierarchical鈥濈殑鍏冪礌銆?/p>

銆€銆€AlphaStar娑堣€楃殑璁$畻閲忓浣曪紵

銆€銆€闂細浣犱滑浣跨敤鐨凾PU鍜孋PU鎬昏绠楁椂闂存槸澶氬皯锛?/p>

銆€銆€David Silver锛氫负浜嗚缁傾lphaStar锛屾垜浠娇鐢℅oogle鐨剉3 TPU鏋勫缓浜嗕竴涓珮搴﹀彲浼哥缉鐨勫垎甯冨紡璁粌璁剧疆锛岃璁剧疆鏀寔浠庢暟鍗冧釜銆婃槦闄呬簤闇?銆嬬殑骞惰瀹炰緥涓涔犵殑agents銆?/p>

銆€銆€AlphaStar鑱旇禌杩愯浜?4澶╋紝姣忎釜agent浣跨敤16涓猅PU銆傛渶缁堢殑AlphaStar agent鐢卞凡鍙戠幇鐨勬渶鏈夋晥鐨勭瓥鐣ョ粍鍚堣€屾垚锛屽湪鍗曚釜妗岄潰GPU涓婅繍琛屻€?/p>

銆€銆€AlphaStar 鍜?OpenAI Five 璋佹洿寮猴紵

銆€銆€闂細璋堝埌OpenAI Five锛屼技涔庡畠鍦―oTA2娓告垙涓穿婧冿紝浣犱滑鏄惁鏈夎繘琛屾鏌ョ湅鐪婣lphaStar鍦╯elf-play涓槸鍚︿細鍑虹幇绫讳技鐨勯棶棰橈紵

銆€銆€David Silver锛氬叾瀹炴湁寰堝涓嶅悓鐨勬柟娉曞彲浠ラ€氳繃self-play瀛︿範銆傛垜浠彂鐜帮紝鍗曠函鐨剆elf-play瀹炵幇寰€寰€浼氶櫡鍏ョ壒瀹氱殑绛栫暐涓紝鎴栬€呭繕璁板浣曟墦璐ヤ互鍓嶇殑绛栫暐銆?/p>

銆€銆€AlphaStar鑱旇禌涔熸槸鍩轰簬agent鐨勮嚜宸变笌鑷繁鎵擄紝浣嗗畠鐨勫鏅鸿兘浣撳涔犳満鍒堕紦鍔盿gent鍦ㄩ潰瀵瑰悇绉嶄笉鍚岀殑瀵规墜绛栫暐鏃惰繘琛屾洿寮虹殑鍗氬紙锛屽苟涓斿湪瀹炶返涓紝闈㈠涓嶅悓瀵诲父鐨勫鎶楁ā寮忔椂锛屼技涔庝細浜х敓鏇村己鐨勮涓恒€?/p>

銆€銆€绁炵粡缃戠粶鎵ц涓€涓姩浣滈渶瑕佸灏戞椂闂达紵

銆€銆€闂細绁炵粡缃戠粶鍦℅PU涓婅繍琛岀殑鏃堕棿鏄?0ms杩樻槸350ms锛岃繕鏄寚鐨勬槸涓嶅悓鐨勪笢瑗匡紙鍓嶅悜浼犻€?vs 鍔ㄤ綔闄愬埗锛夛紵

銆€銆€David Silver锛氱缁忕綉缁滄湰韬渶瑕佸ぇ绾?0ms鏉ヨ绠椾竴涓姩浣滐紝浣嗚繖鍙槸鍙戠敓鍦ㄦ父鎴忎簨浠跺拰AlphaStar瀵硅浜嬩欢浣滃嚭鍙嶅簲涔嬮棿鐨勫鐞嗙殑涓€閮ㄥ垎銆?/p>

銆€銆€棣栧厛锛孉lphaStar骞冲潎姣?50ms瑙傚療涓€娆℃父鎴忥紝杩欐槸鍥犱负绁炵粡缃戠粶闄や簡鍔ㄤ綔锛堟湁鏃剁О涓烘椂闂存娊璞″姩浣滐級涔嬪锛岃繕浼氶€夋嫨涓€浜涙椂闂寸瓑寰呫€?/p>

銆€銆€鐒跺悗锛岃瀵熺粨鏋滃繀椤讳粠Starcraft浼犻€掑埌Starcraft锛岄櫎浜嗙缁忕綉缁滈€夋嫨鍔ㄤ綔鐨勬椂闂翠箣澶栵紝杩欏張澧炲姞浜?0ms鐨勫欢杩熴€傛€荤殑鏉ヨ锛屽钩鍧囧弽搴旀椂闂存槸350ms銆?/p>

銆€銆€AlphaStar瀵规垬MaNa杈撴帀鐨勯偅涓€鍦哄師鍥犳槸浠€涔堬紵

銆€銆€闂細璁稿浜哄皢AlphaStar鐨勫崟娆″け鍒╁綊鍜庝簬绠楁硶鍦ㄦ渶鍚庝竴鍦烘瘮璧涗腑琚檺鍒朵簡瑙嗚銆傛垜涓汉骞朵笉璁や负杩欐槸涓€涓护浜轰俊鏈嶇殑瑙i噴锛屽洜涓虹浉浣嶆1闀滃湪鎴樹簤鐨勮糠闆句腑杩涜繘鍑哄嚭锛岃€孉I鍒欏湪鏁翠釜鍐涢槦涓潵鍥炵Щ鍔ㄤ綔涓哄洖搴斻€傝繖鐪嬭捣鏉ョ粷瀵瑰儚鏄悊瑙d笂鐨勫樊璺濓紝鑰屼笉鏄満姊版搷浣滀笂鐨勫眬闄愩€備綘瀵笰lphaStar浠ヨ繖绉嶆柟寮忓け璐ョ殑鍘熷洜鏈変粈涔堢湅娉曪紵

銆€銆€David Silver锛氬緢闅捐В閲婃垜浠负浠€涔堜細杈撴帀锛堟垨璧㈠緱锛変换浣曚竴鍦烘父鎴忥紝鍥犱负AlphaStar鐨勫喅绛栧緢澶嶆潅锛屾槸鍔ㄦ€佸鏅鸿兘浣撹缁冭繃绋嬬殑缁撴灉銆?/p>

銆€銆€MaNa鎵撲簡涓€鍦洪潪甯哥簿褰╃殑娓告垙锛屼技涔庡彂鐜板苟鍒╃敤浜咥lphaStar鐨勪竴涓急鐐光€斺€斾絾鏄緢闅捐杩欎釜寮辩偣鏄敱浜庢憚鍍忓ご銆佽緝灏戠殑璁粌鏃堕棿銆佷笉鍚岀殑瀵规墜绛夌瓑锛岃€屼笉鏄叾浠朼gent銆?/p>

銆€銆€AlphaStar鏄粠鎽勫儚澶磋繕鏄粠API鑾峰彇淇℃伅锛?/p>

銆€銆€闂細鏈姣旇禌涓瑼I鏄彲浠ョ湅鍒板叏鍦板浘鐨勩€傝繖涓庝粠API涓幏鍙栧師濮嬫暟鎹苟绠€鍗曞湴灏嗗畠浠娊璞′负缁撴瀯鍖栨暟鎹綔涓篘N鐨勮緭鍏ユ湁浣曚笉鍚岋紵浼间箮鏂扮増鏈笉鍐嶄娇鐢ㄨ绱犲浘灞備簡锛烶ySC2锛圖eepMind鐨勬槦闄呬簤闇窱I瀛︿範鐜鐨凱ython缁勪欢銆傚畠灏嗘毚闆ū涔愮殑鏄熼檯浜夐湼II鏈哄櫒瀛︿範API鏆撮湶涓篜ython RL鐜锛変腑寤虹瓚鐨勭姸鎬侊紝鏄湪閫犱腑銆佸凡寤烘垚绛夌瓑銆傝繖浜涗俊鎭湪camera_interface鏂规硶涓槸濡備綍淇濈暀鐨勶紵

銆€銆€Oriol Vinyals锛氬疄闄呬笂锛岄€氳繃鎽勫儚澶达紙鍜岄潪鎽勫儚澶达級鎺ュ彛锛屽綋鎴戜滑灏嗗叾浣滀负鍒楄〃杈撳叆锛堢敱绁炵粡缃戠粶鍙樻崲鍣ㄨ繘涓€姝ュ鐞嗭級鏃讹紝鏅鸿兘浣撳氨鑳借幏寰楁槸浠€涔堝缓绛戣琚缓閫犲嚭鏉ョ殑淇℃伅銆?nbsp;

銆€銆€閫氬父锛屽嵆浣挎病鏈変繚鐣欒繖鏍风殑鍒楄〃锛屾櫤鑳戒綋涔熶細鐭ラ亾浠€涔堝缓绛戣寤洪€犲嚭鏉ャ€傛櫤鑳戒綋鐨勫唴瀛橈紙LSTM锛夎窡韪墍鏈夊厛鍓嶅彂甯冪殑鎿嶄綔锛屼互鍙婅繃鍘昏闂繃鐨勬墍鏈夋憚鍍忓ご浣嶇疆銆?/p>

銆€銆€鎴戜滑纭疄涓哄皬鍦板浘浣跨敤浜嗚绱犲浘灞傦紝浣嗘槸瀵逛簬灞忓箷锛屾偍鍙互灏嗚绱犲垪琛ㄨ涓衡€滆浆缃€濊淇℃伅銆備簨瀹炶瘉鏄庯紝鍗充娇鏄鐞嗗浘鍍忥紝灏嗘瘡涓儚绱犱綔涓哄垪琛ㄧ嫭绔嬪鐞嗭紝涔熻兘寰堝ソ鍦板伐浣滐紒鏇村淇℃伅璇峰弬闃咃細https锛?/arxiv.org/abs/1711.07971

銆€銆€AlphaStar鐨勪袱鐧惧勾鐩稿綋浜庝汉绫诲涔呮椂闂达紵

銆€銆€闂細鏈夊灏戠被浼兼槦闄呬簤闇歌繖绉嶉渶瑕?00骞磋缁冩椂闂寸殑娓告垙锛?/p>

銆€銆€Oriol Vinyals锛氬钩鍧囨瘡鍦烘瘮璧涙寔缁?0鍒嗛挓锛岃繖鐩稿綋浜庡ぇ绾?000涓囧満姣旇禌銆備絾璇锋敞鎰忥紝骞堕潪鎵€鏈夋櫤鑳戒綋閮界粡杩囬暱杈?00骞寸殑鍩硅锛岃繖鏄悇绉嶇増鏈殑AlphaStar涓櫤鍟嗘渶楂樼殑銆?/p>

銆€銆€AlphaStar濡備綍鏀掗挶鐢熸垚楂樼骇鍏电锛?/p>

銆€銆€闂細瀹冩€庝箞瀛︿範鍒扳€滀负鏌愮鐩殑瀛橀挶鈥濓紝姣斿鏀掗挶鐢熸垚楂樼骇鍏电锛熻繖绉嶁€滀笉浣滀负鈥濈殑鎿嶄綔琚О浣淣OOP锛屽湪RL绠楁硶涓紝浼氳秺鏉ヨ秺澶氱殑璁や负NOOP鏄潪鐞嗘兂鐐圭殑鏈€浣冲喅绛栥€?/p>

銆€銆€David Silver锛氫簨瀹炰笂AlphaStar閫夋嫨鎵ц澶氬皯娆OOP锛屽氨鏄綔涓哄叾琛屽姩鐨勪竴閮ㄥ垎銆?/p>

銆€銆€杩欓鍏堟槸浠庣洃鐫f暟鎹腑瀛︿範鐨勶紝闀滃儚浜虹被鎿嶄綔锛岃繖鎰忓懗鐫€AlphaStar閫氬父浠ヤ笌浜虹被鐜╁绫讳技鐨勯€熷害杩涜鈥滅偣鍑烩€濇搷浣溿€?nbsp;

銆€銆€鐒跺悗閫氳繃寮哄寲瀛︿範鏉ユ敼杩涳紝鍙互閫夋嫨鍑忓皯鎴栧鍔燦OOP鐨勬暟閲忋€?鍥犳锛岄€氳繃浜嬪厛瑙勫垝濂芥湁鍑犱釜NOOP锛屽彲浠ュ緢瀹规槗鍦板疄鐜扳€滀负X鐪侀挶鈥濄€?/p>

銆€銆€AlphaStar鐨勮緭鍏ユ暟鎹槸瀹炴椂鐨勫悧锛?/p>

銆€銆€闂細鏈€缁堜娇鐢ㄧ殑姝ラ暱鏄灏戯紵鍦ㄥ崥瀹腑浣犲啓閬擄紝鏄熼檯浜夐湼鐨勬瘡涓€甯ч兘琚敤浣滆緭鍏ョ殑涓€姝ャ€備絾鏄紝浣犺繕鎻愬埌骞冲潎澶勭悊鏃堕棿涓?0ms锛岃繖灏嗚秴杩囧嵆鏃舵父鎴忕粰瀹?2.4fps鏃堕渶瑕?lt;46ms鐨勮姹傘€傛墍浠ヤ綘浠槸閫愬抚浣滀负杈撳叆锛岃繕鏄殧甯у憿锛熼殧鐨勫抚鏁版槸鍥哄畾杩樺姩鎬侊紵

銆€銆€Oriol Vinyals锛氭垜浠槸閫愬抚鐨勶紝浣嗘槸鐢变簬寤惰繜鍜屾偍娉ㄦ剰鍒扮殑鍑犱釜寤惰繜锛屾搷浣滃皢浠呭湪璇ユ楠ょ粨鏉熷悗澶勭悊锛堝嵆锛屾垜浠紓姝ユ挱鏀撅級銆?鍙︿竴绉嶉€夋嫨鏄攣瀹氭楠わ紝杩欎娇寰楃帺瀹剁殑娓告垙浣撻獙涓嶆槸寰堝ソ锛氾級

銆€銆€AlphaStar杩樿兘鐜╂槦闄?鐨勫叾浠栧湴鍥惧悧锛?/p>

銆€銆€闂細浣犱滑鏄惁鍋氳繃娉涘寲 锛坓eneralizations锛?娴嬭瘯锛熷亣璁炬病鏈変竴涓猘gent鍙互閫夋嫨涓嶅悓鐨勬棌鏉ユ墦锛堝洜涓哄彲鐢ㄧ殑鍗曞厓/鎿嶄綔鏄畬鍏ㄤ笉鍚岀殑锛岀敋鑷冲湪鏋舵瀯涓婁篃涓嶈兘宸ヤ綔锛夛紝浣嗘槸鑷冲皯搴旇鑳芥帹骞垮埌鍏朵粬鍦板浘锛屾槸鍚楋紵

銆€銆€David Silver锛氭垜浠疄闄呬笂锛堟棤鎰忎腑锛夋祴璇曚簡杩欎釜銆傛垜浠湁涓€涓狝lphaStar鐨勫唴閮ㄦ帓琛屾锛屾垜浠病鏈夊皢鎺掕姒滅殑鍦板浘璁剧疆涓篊atalyst锛岃€屾槸灏嗗瓧娈电暀绌衡€斺€旇繖鎰忓懗鐫€瀹冭兘鍦ㄦ墍鏈夌殑Ladder 鍦板浘涓婅繍琛屻€?/p>

銆€銆€浠や汉鎯婅鐨勬槸锛宎gent浠嶇劧寰堝己澶э紝琛ㄧ幇涔熷緢涓嶉敊锛屽敖绠¤繕涓嶈兘杈惧埌鎴戜滑鏄ㄥぉ鍏紑鐨勯偅涓按骞炽€?/p>

銆€銆€鍙敤鍙板紡鏈哄浣曞湪鏈哄櫒瀛︿範鍜屽己鍖栧涔犻鍩熷彇寰楀ソ鎴愮哗锛?/p>

銆€銆€闂細浣犳湁浠€涔堝缓璁甅L/RL鐖卞ソ鑰呭叧娉ㄧ殑棰嗗煙鍚楋紵鍝簺棰嗗煙涓嶉渶瑕佽秴杩囧彴寮忔満绾у埆鐨勮绠楄祫婧愬氨鍙互鍋氬嚭鏈夌敤鐨勮础鐚紵

銆€銆€Oriol Vinyals锛氭湁寰堝浜嬫儏涓嶉渶瑕佸ぇ閲忚绠楄祫婧愬氨鍙互鍋氾紝鍙互鎺ㄨ繘ML鐨勮繘姝ャ€?/p>

銆€銆€鎴戞渶鍠滄鐨勪緥瀛愭槸鎴戜滑鍋氭満鍣ㄧ炕璇戠殑鏃跺€欙紝鎴戜滑寮€鍙戜簡涓€涓彨鍋歴eq2seq鐨勪笢瑗匡紝瀹冩湁涓€涓ぇ鍨嬬殑LSTM锛屽湪鏈哄櫒缈昏瘧涓揪鍒颁簡state of the art鐨勬€ц兘锛屽苟涓斿彧浣跨敤浜?涓狦PU璁粌銆?/p>

銆€銆€涓庢鍚屾椂锛岃挋鐗瑰埄灏斿ぇ瀛﹀紑鍙戜簡鍙仛鈥渁ttention鈥濈殑鏈哄埗锛岃繖鏄疢L鎶€鏈殑涓€涓牴鏈€ц繘姝ワ紝浣垮緱妯″瀷鍙樺緱鏇村皬锛屼粠鑰屼笉闇€鍦ㄥぇ鍨嬬‖浠朵笂杩愯銆?/p>

銆€銆€鏅€氱帺瀹朵綍鏃惰兘瀵规垬AlphaStar锛?/p>

銆€銆€闂細鍦?1鏈?Blizzcon鐨勬紨璁蹭腑锛孖IRC Vinyals璇翠粬寰堜箰鎰忓皢SC2 bot寮€鏀剧粰鏅€氱帺瀹躲€傝繖浠朵簨鏈変粈涔堣鍒掑悧锛?/p>

銆€銆€Oriol Vinyals锛氳繖璁╀汉鍏村锛佹垜浠潪甯告劅璋㈢ぞ鍖虹殑鏀寔锛屾垜浠笇鏈涘皢绀惧尯鐨勫弽棣堢撼鍏ュ埌鎴戜滑鐨勫伐浣滀腑锛岃繖涔熸槸涓轰粈涔堟垜浠鍙戝竷杩?0涓父鎴忓洖鏀句緵绀惧尯鍘昏瘎璁哄拰娆h祻銆傛垜浠皢闅忔椂鍛婅瘔澶у鎴戜滑鐨勮鍒掕繘灞曪紒

銆€銆€鍙傝€冮摼鎺ワ細銆€銆€https锛?/www.reddit.com/r/MachineLearning/comments/ajgzoc/we_are_oriol_vinyals_and_david_silver_from/

(璐g紪锛氭▕鐠愮拹)

网友评论:

Copyright © 2002-2018 U体育 版权所有 标签

[xuanzang:sitemap]
Top