Dataloreパブリックベータ – 機械学習向けのWebアプリケーション
2月12日、Dataloreのパブリックベータを公開しました。Pythonによるデータ解析とビジュアライゼーション向けのインテリジェントなWebアプリケーションです。
今日、機械学習は多くの商用アプリケーション、研究プロジェクトの肝となっています。DataloreでJetBrainsプロダクトファミリに機械学習に特化した環境を追加します。
このプロダクトはJetBrainsのビジョンである、誰にとっても開発を楽しく生産性が高いものにするというビジョンに基づいてローンチしました。Dataloreはスマートなコーディングアシスタンス、インクリメンタルコンピュテーション、内蔵の機械学習ツールによりデータ処理を楽しいエクスペリエンスに変えます。
インテリジェントで簡単に使えるコードエディタ
データサイエンスは生データから様々な洞察を得る技術ですが、多くの場合コーディングを必要とします。機械学習のコーディングを楽しく簡単なものとするため、Dataloreはスマートなコード補完、インスペクション、クイックフィックスとナビゲーションを提供します。
コーディングタスクをシンプルにするため、書いているコードの文脈に応じたサジェスチョンを提示する「インテンション」があります。最適なインテンションをクリックすることでDataloreはデータセットをアップロード、トレーニング、テスト、分割、デザインなど様々なことを行うコードを生成します。
インクリメンタルコンピュテーション
洗練された学習モデルを得るには試行錯誤が必要です。たとえばパラメータをいくつか調整することで、挙動にどのような影響が起こるのか確認したいとき、すぐに結果が得られればうれしいはずです。Dataloreはワークブック内の様々なコンピュテーションの依存関係を解析し、変更により必要となる再計算の量を最小化します。これにより、スクリーン右側に表示されるアウトプットはあなたのアイディアを迅速に反映します。
様々なマシンラーニングツールを最初から用意
データアナリストがDataloreを使う際に必要となるツール群であるnumpy、pandas、sklearnといったPythonライブラリ群は最初から用意してあります。
さらに二つの先進的なビジュアライゼーションライブラリを開発しました。ひとつはdatalore.plotで、Rで実装されたggplotのinspired by the “grammar of graphics”にインスパイアされたライブラリです。そしてもう一つはdatalore.geo_mapsで、解析結果にインタラクティブな地図を追加するものです。
Iris、MNIST、Titanicなどのデータセットを最初から用意しており、便利なファイルマネージャで独自のデータセットを.csvフォーマとでアップロードすることも可能です。
編集内用は自動で保存されますので編集結果を失う心配はありません。バージョン管理システムを備えていますので、何かおかしくなったらファイルヒストリーから以前のモデルにロールバックできます。
コラボレーション
コードエディタはリアルタイムにワークブックをリモートから編集できますので、アイディアについて議論しながらチームメイトがコードを追加したり、コメントを入れたりできます。
様々なコンピュートインスタンス
Dataloreではタスクに応じてさまざまなコンピュートリソースを選ぶことが出来ます。シンプルなアルゴリズムは小さなコンピュートエージェントで、ディープラーニングアルゴリズムはパワフルなエージェントで動作させられます。より大規模なインスタンスが必要な場合はDatalore forumよりお問い合わせください
今後は?
まずdatalore.ioよりお試しください!
是非Datalore forumへフィードバックを寄せてください。また、問題があれば教えてください。Twitterアカウントも用意しております。Dataloreはまだ開発中で、より改善するための皆様のご意見を楽しみにしております!
Datalore Team
[原文]