Pythonでちょっとしたデスクトップアプリを作りたい場面というのは、意外と多いものだ。ファイルを選択したり、オプションを選んだり、エディタにメッセージを入力してもらうなど、簡単なUIが必要なだけであれば、先日紹介したTkEasyGUIでも十分だろう。
ブラウザ操作を自動化するにはPlaywrightやSeleniumを使って操作手順を細かく指示する必要がありました。そこでLLMが画面内容を判断し、自然言語の指示からクリック・入力・検索を実行できるオープンソース「Browser-Use」が公開されています。 実際にブラウザ ...
人間やAIエージェントがコマンドラインから指示することでWebブラウザを操作できるオープンソースのPythonライブラリ「Browser Use CLI 2.0」がリリースされました。 Browser Use CLI 2.0では、Chromeブラウザに対してChrome DevTools Protocol(CDP)で接続して操作できるよう ...
browser-use 自体はpipのライブラリであるためこの1行でOK。 playwright は、筆者も初めて使ったのだが、主な用途は E2Eテスト 自動化フレームワークとのこと。 Microsoftが開発している。 動かすには簡単なコードが必要となる。 たとえばtest.pyに以下のコードを記述。
AI agents are slowly becoming a thing, but many people aren’t aware of how to get started with them, especially how to connect an AI agent to their browser and perform different tasks such as ...
PyScriptが強力なのは、JavaScriptなどにコンパイルされて実行される訳ではなく、WASMを利用してC言語で実装されたPythonその ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する