あぁ今週も誰とも会話しなかった・・・

専業トレーダー。完全無欠の引篭もり。人と一切の関わりを持たない生活。

二次元ヒロインに本気で心を動かされる「Doki Doki Literature Club !」

とりあえず何も聞かずにやってみてって、

何がどうなのか言いたいけど、言ってしまうとネタバレになるから、

Steamで出来るから、

無料だから、

数時間で終わるから、

ほら、

ほらほらほらほら、
store.steampowered.com

 

日本語パッチ
steamcommunity.com

 

 

成人年齢18歳は成人することの嬉しさを限りなく0にする気がする。

20歳になったとき僕以外のみんなは嬉しかったんだろうか。

僕は別に嬉しくなかった。どちらかと言えば嫌な気持ちすらした。

というもの僕は大人になる事を社会の歯車として消費されることと同義に捉えていたからだ、銀河鉄道999でいうところの僕は今後一生ネジの体で生きていかないといけないんだなってやつだ。

思うに日本の若者でそういうイメージを持っている人は多いのではないだろうか、社会に出て特権階級になれることが決まっている、もしくはなれると思っている層以外の大部分は僕に近い感覚を持っているのではないだろうか。

そんなことは何も考えていない様に見える荒れる成人のみなさんでさえ、あの姿はこれから何かを始めようとする入学式ではなく、何かが終わりになる卒業式の様に見える。僕の通っていた中学の卒業式には特攻服で出て来るあんな感じの同級生がそれないりにいた、青春時代の思い出として最後にドカンと盛り上がってやろうということだろう。まあ荒れる成人の心の内を深く読んでみても仕方が無いとは思うが、彼らの中にそんな思いがあるのならば納得はいく、まさか流石の彼らも成人を期に今後の人生をずっとあのスタイルで生きていくためのスタートにしようとは思っていないだろう。

話がそれたが、ともあれ僕は特権階級になることもなかったが幸いなことに歯車になることも拒否したまま何とかやってこれているのでありがたいことなのだが、それでも未だに成人して良かったと思う事は別に無い。

こんなことを言っていると、何を言っているんだ、成人するということは社会の一員として責任を持って生きていくということで、そうやって社会を支える一員となれたことがめでたいんだ、と言われるかもしれないが、正論ですね、本当にそんなことがめでたいか?それがめでたいと思えるならそのことがめでたいな、言い過ぎた、先ほどの発言を訂正はしないがお詫び致します。

さて本題だが、そんなことを思っていた僕でさえも実際20歳になったとなれば、成人式に出て地元の同級生と再会し酒でも飲みに行って盛り上がろうじゃないかってことになる訳だ。ごちゃごちゃ言わずにめでたいめでたいって話だ。

ところが、18歳で成人されるみなさんはそれすらできないそうではないか、お酒は20歳になってから、成人になったお祝いにみんなでドリンクバーでジュースでも飲めと?

まあまあ嫌なことは考えずにお酒でも飲んで盛り上がろうやという、その一点だけで成人に対する負の側面全てに目をつぶってやろうというそのイベントすらできないとなると、これはもう成人してなんか良いことあるのかな?と考えるだろう、そして考えたが最後だ、何も思い付かないだろう。

今のところ年金の徴収は20歳からのままらしいが、こんなもの何をどう考えたってそれ以外に目的が思い浮かばない、例のいつものやり方でほとぼりが冷めた頃18歳に引き下げられるだろう。遅かれ早かれ成人の日は年金を払えるめでたい日になるのだ。より一層大人になりたくない国にしたいのだろうか。

当時、大学受験を数日後に控えた18歳の僕が成人を迎えていたら、おめでとうと言ってきた全員に、え?何が?何がめでたいの?と返していただろう。良かった、20歳で成人して。

 

 

 

 

 

 

トレーダーはポーカーをするべき論。

f:id:hari-nezumi:20180610183214p:plain

https://www.pokerstars.com/ja/

 

ポーカーをゴリ押していくよ。

正直いままでポーカーってただの運ゲーであんまり面白くないと思ってんだけど、

テキサスホールデムめっちゃ面白い、僕の知ってるポーカーはポーカーじゃなかった。

 

確かに1回1回のゲームは運ゲーなんだけど、トータルで勝てるかどうかはまったく運じゃない、格上のプレーヤーにたまたま初心者が数回連続で勝てることがあったとしても、ゲームを続けていけば確実に全部持っていかれる。

 

これって何かに似ていないだろうか、

そう、

トレードだ。

 

トータルで勝てる様になるかどうかの技術が完全にトレードと被っている、

勝てるようになるって言葉に「トータルで」なんて頭を付ける必要があることなんかからしてそっくり。

 

例えば、まだ始めたばっかりだから負け方しか詳しくないのだが、こうだ、

 

勝つ時は確実に確実にと小さく張って小さく取っているのに負ける時に限って大きく張らされている。これはコツコツドカンってやつだ。

 

微妙な手で相手のレイズにコールしてしまい、さらにレイズされた時にこれは微妙な手だって思っているのに取り戻したいと思ってコールを重ねてしまう。これは損切できない時と全く同じ心境になる。

 

良い手が入らずにフォールドが続いていると、これどうだろうって手で勝負にいってしまう、これはポジポジ病に通じる。

 

あーーぁ、これトレードで学んだじゃん、あーーもーーって何回も思った。

 

 

僕が言ってるだけじゃホントかよ、と思うかもしれない、ならこうだ。

f:id:hari-nezumi:20180610185909p:plain

この本こないだも載せたけれども、ポーカーに勝つ思考について書かれている、

第2章のチャプターを紹介しよう、

 

2-1 ポーカーのさまざまな現実を理解し受け入れる

2-2 長期的視野でプレイする

2-3 金を儲けることよりも正しい決断を下すことを優先する

2-4 金への執着を捨てる

2-5 自尊心を持ち込まない

2-6 あらゆる感情を決断から排除する

2-7 分析と改善のサイクルを継続的に繰り返す

 

どうだろうか、これはもうトレードの本と全く同じだと言っても過言ではないだろう。

 

つまりポーカーで勝つということの本質はこれほどトレードとそっくりだということだ。

 

何かを習得したい時に一つの側面から見ているだけでなく別の側面からも見てみるということは理解を深めるという点でたいへん意義があると僕は思う。

 

ちなみに僕は、相場で騙しに合うとイラっとしてしまうのだが、これがポーカーで克服できる気がしている、ポーカーをしていると相手がブラフを使ってくるのは当然なのでいちいちイラっとしていても仕方が無い、むしろそこから何を読み取るかに集中すべきなのだ、たぶん相場もそうなのだろう。

 

 

誘い方が理屈っぽい!いやもう、面白いんだって、ほんとに!

僕はこれホームゲーム立てて言葉が通じる人とやりたいんだって!

相手がイタリア人じゃ挨拶すらできないよ、というか言葉が通じないのが前提になってるからかもしれないけどチャット機能あるのに誰も挨拶すらしないからね、まあ話しかけられたらビビッて回線切っちゃうと思うけど。

 

 

 

 

 

CFRー反事実的後悔最小化の論文を読もう。

 

hari-nezumi.hatenablog.com

 これの続き。

 

まず前提として僕にはゲーム理論とプログラムの知識が全然無い。

だから訳しても意味がよくわからない、

というか訳せない、

日本語ってコンピューターの分野に全然追い付いてない、いや、むしろ追い付くのを諦めてる。

 

algorithm of regret matching

はいこれ、なんて訳すの?リグレットマッチングアルゴリズムだよね。

無理やり訳せば、後悔組合せ方式、なんだろうけど、意味がわからん。

まあ訳すのは諦めたとして、マッチングアルゴリズムってどういうアルゴリズム?わからん。

 

curricular materials

カリキュラムマテリアル

カリキュラム資料?カリキュラム素材?カリキュラムってカリキュラムだよね?

 

innovations

イノベーション

いのべーしょん!意識高そう!

 

positive regrets

ポジティブリグレットって何?

この言葉はこんな文脈で使う、

「プレイヤーは将来のプレイをポジティブリグレットに比例したものにするために、過去のプレイに対するリグレットを追跡して均衡プレイに至る。」

はあああ??

いや、訳としてはこれであってるからね。

ちゃんと訳してるのに意味がわからんしルー大柴かってくらいカタカナだらけになる。

 

1-die-versus-1-die Dudo

これ、普通にわからん、たぶんゲームの名前なんだけど、1対1のサイコロDudo、デュードってなに?これプログラムとかゲーム理論とか全然関係ない言葉のはずなんだけど調べても出て来ないんだよね。

 

imperfect recall abstraction

不完全なリコール抽象化

あ゛?

 

demonstrate application of the algorithm

アプリケーションのアルゴリズムをデモンストレーションする。

日本語が息をしていない。

 

memory of 3 claims

3クレームのメモリー

これ普通に用語としてわからん。

 

hari-nezumi.hatenablog.com

 はい、そんなこんなで導入部分だけ訳して力尽きたよ。

だれか訳して・・・もしくは訳した日本語を解説して・・・

2節からが読みたいところなんだけど、気力が・・・

 

 

 

反事実的後悔最小化の導入(訳せてない)

http://modelai.gettysburg.edu/2013/cfr/cfr.pdf

元の論文

 

反事実的後悔最小化の導入

1.動機

  2000年に、HartとMas-Colellは、重要なゲーム理論、リグレットマッチングアルゴリズム(後悔組合せ方式?)を導入した。プレイヤーは将来のプレイをポジティブリグレット(正の後悔?)に比例したものにするために、過去のプレイに対するリグレット(後悔)を追跡して均衡プレイに至る。

  この手法は単純で直感的であるだけでなく、最も難しいブラフを使うゲームにおけるコンピュータゲームプレイの革命を起こした。これには年一回のコンピューターポーカー大会での明確な優勢も含まれる。このアルゴリズムは比較的最近のものであるため、この分野における次世代の研究者や実践者がリグレットベースのアルゴリズムを導入するために利用できるカリキュラム資料がほとんどない。これらの資料は最新のイノベーションを、上級コンピューターサイエンス学部の学生や院生、興味を持っている研究者や野心的な実践者が、より利用しやすくするための控えめな第一歩として意義がある。

  第2節では、プレイヤーリグレットの概念を紹介し、じゃんけんの例を読み書きできるプログラミングスタイルで提示しすることで後悔マッチングアルゴリズムを説明するとともに、プレイヤーリグレットの概念と例題との関連を示す。

  Counterfactual Regret Minimization(CFR)(反事実的後悔最小化)はクーンポーカーを解く実例を使って第3節で紹介している。また1対1のサイコロDudo(デュード)をプレイする実際的なCFRの試作を最適化するための支援コードが提供されている。

  第4節では、多くの場合結果を改善することができる、おおよそ最適に計算されたポリシーである「クリーニング」の手段に簡単に触れる。

  第5節は、繰り返し状態のゲームに適用する高度なCFRのアプリケーション(例えば、不完全なリコール抽象化)をカバーする、これはCFRトレーニング反復の計算上の複雑さを指数関数から線形に減少させる。ここでは、アルゴリズムのアプリケーションをデモンストレーションするために私たちが独自に考案したゲーム「Liar Die」を使う。私たちは読者がこのテクニックを3クレームのメモリーとして1対1サイコロDudoに適用することを想定している。

  第6節では、公開研究の問題について簡単に議論する。可能な均衡戦略の中で、相手のエラーを最適に利用するものをどのように計算しますか?読者は、この興味深い問題の洞察を得るために、例とした「Liar Die」のコードを修正することを依頼されている。

  最後に、第7節では、継続的な学習の問題と道筋にさらに挑戦します。

 

2.ゲームでの後悔

 

この節では、コンピュータが自己シミュレートしたプレイを通して、将来の選択に情報をあたえるために、過去のゲームの選択肢の後悔を使用する手段を説明する。 まず、慣れた親しんだゲームのじゃんけんを紹介する。 ゲーム理論の基礎的な用語を定義した後、後悔マッチングについて議論し、期待される後悔を最小限に抑えるアルゴリズム計算戦略を提示する。このアルゴリズムを使用して、じゃんけん戦略および関連する演習を学習するための実例を提示する。

 

2-1じゃんけん

 

 じゃんけんは岩、紙、ハサミの3つのジェスチャーのそれぞれを同時に行う2人プレイのゲームだ。

他のプレーヤーに勝つ、負けさせる、または引き分ける機会がある。同じジェスチャーを出したプレイヤー同士は引き分けだ。「岩はハサミを壊す」ので岩はハサミに勝つ。「ハサミは紙を切る」のでハサミは紙に勝つ。「紙は岩を包む」ので紙は岩に勝つ。プレイヤーは通常、4拍の詠唱をすることでプレイを同期させます。“Rock! Paper! Scissors! Shoot!”最初の3拍に指を伸ばした手のひらを細かく上下させ、4番目の拍に3つのジェスチャーのうちの1つを同時に表明する。

 

2-2ゲーム理論の定義

 

このようなゲームを最適に、または完全にプレイすることは、どういう意味だろう?この質問は、相手のプレイによって決まる勝ち負けの差し引きを最大化する、というようないくつかの意味をもつだろうか?この節では、ゲーム理論からのいくつかの基本的な用語と定義を紹介し、最適なプレイのための解法の概念を考察する。ここでは、[12]の表記と用語に従います。まず、ノーマルフォームのゲームをタプル(NAu)として定義する。ここで

 

N = {1...n}n人の選手の無限集合         

Siは、プレイヤーiの行動や選択肢の無限の集合 

A = S1×... Snは、すべてのプレイヤーの同時アクションのすべての可能な組み合わせの集合

(同時アクションの可能な組み合わせはそれぞれ、アクションプロファイルと呼ばれる。)

uは、各アクションプロファイルを各プレイヤーのユーティリティのベクトルにマッピングする関数。私はプレーヤーiペイオフuiと呼んでいる。

 

ノーマルフォームのゲームは、各プレイヤーが1つの選択しかしないため、一般に「ワンショットゲーム」とも呼ばれる。 ノーマルフォームのゲームはn次元テーブルとして表される、各次元は一人のプレーヤのアクションに対応する行/列を有し、各テーブルエントリは、一つのアクションプロファイル(各プレイヤからの一つのアクションの交差点)に対応し、テーブルエントリは各プレーヤのユーティリティ(ペイオフまたは報酬)のベクトルが含まれている。じゃんけんのペイオフテーブルは次のとおりだ、

                                    f:id:hari-nezumi:20180606024006p:plain