前回、離散値ってなんや?というnoteで 強化学習で必要な離散値とは何か?なぜ必要なのか? について書きました。 今回は具体的に離散値に変換していきます。 今回やるのはこちらのコードです。 q_table = np.random.uniform(low=-1, high=1, size=(4 ** 4, env.action_space.n ...
#for creating vectors Vec=np.array([1,2,3,4,5,6,7,8,9,10,11]) print(Vec) #for creating matrix Matrix= np.array([[1,2,3], [4,5,6],[7,8,9]]) print (Matrix) #transpose ...