Posit、SQL用のグラフィック文法「ggsql」のアルファ版リリース
原題: ggsql: A Grammar of Graphics for SQL
なぜ重要か
SQLとデータ可視化を統合する新アプローチで、データサイエンス分野の生産性向上に寄与する可能性
Posit社が4月20日、SQL構文内で直接データ可視化を記述できる新ツール「ggsql」のアルファ版をリリースした。同ツールはgrammer of graphics概念をSQLに実装し、Quarto、Jupyter notebook、Positron、VS Codeなどで利用可能。VISUALIZEとDRAWコマンドでデータマッピングから描画まで一貫してSQL内で実行できる。
Posit社のThomas Lin Pedersen氏らの開発チームが、SQL内でデータ可視化を直接記述できる「ggsql」のアルファ版を発表した。このツールはgrammer of graphicsの概念をSQL構文で実装したもので、構造化された豊富な可視化機能をSQLにもたらす。
ggSQLの基本的な使用方法は、VISUALIZEコマンドでデータマッピングを定義し、DRAWコマンドでレイヤーを描画する仕組みとなっている。例えば散布図の場合、「VISUALIZE bill_len AS x, bill_dep AS y FROM ggsql:penguins DRAW point」のように記述する。
同ツールの特徴は、事前定義されたプロットタイプではなく、モジュラー部品を組み合わせて段階的にグラフを構築できる点にある。マッピングの追加、レイヤーの重ね合わせ、スケールの制御などが柔軟に行える。実際の例では、散布図に回帰線を追加する場合「DRAW smooth」を単純に加えるだけで実現できる。
現在、Quarto、Jupyter notebook、Positron、VS Codeなどの環境で利用可能となっており、TidyTuesdayの可視化例の移植なども紹介されている。開発チームは、SQLの冗長性があるものの、コードを声に出して読めば内容が理解できる明確性を利点として挙げている。