DATAFLUCT Tech Blog

データ技術・データサイエンス・MLOps に関するトレンドを追いかけます

やってみた

お手軽で高速なFastAPIでCloudRunに推論APIを公開するまで

FastAPIとは 特徴 API作成までの手軽さ Flaskよりも非常に高速 ドキュメントの自動生成 簡単なAPIを作る インストール シンプルなGETのAPIを作る 自動生成されるドキュメント 推論APIを作る 学習済みモデル(.pkl)の読み込み リクエストボディから推論を行う …

Tensorflow Data Validationを用いた機械学習用データセットの検証方法

こんにちは!nakamura(@naka957)です。本記事では、TensorFlowの拡張機能であるTensorFlow Data Validationを用いたデータセット検証を行う方法をご紹介します。 データセット検証とは、機械学習モデルの構築時に使う訓練データと運用データの間の違いを調…

PyCaretからAutoVizを使用して探索的データ分析(EDA)を簡単に行ってみる

こんにちは!nakamura(@naka957)です。本記事では、PyCaretで簡単に探索的データ分析を行う方法をご紹介します。 探索的データ分析(Explanatory Data Analysis: EDA)とは、データセットを様々な視点から分析し、データを考察することを目的に行うことで…

データドリフトを簡単検知!PythonライブラリEvidentlyを使ってみた

こんにちは!nakamura(@naka957)です。今回は機械学習モデルの運用時で特に問題となるドリフトを検知するOSSをご紹介します。 本番環境のモデル精度が低下する現象をドリフトと呼びます。特にデータ由来をデータドリフトと呼びます。 機械学習はデータから…

密度分布を比較するためJoyPyでサクッと重ねてみた

こんにちは!nakamura(@naka957)です。今回は可視化で便利なOSSをご紹介します。1次元密度分布をさくっと描画でき、データの傾向を簡単に比較できます。 JoyPyとは ライブラリの読み込み データセットの準備 Joyplotsを試してみる グラフの色をデザインす…

AutoMLライブラリPyCaretを使ってみた〜モデル実装から予測まで〜

こんにちは!nakamura(@naka957)です。今回は少ないコードで機械学習を簡単に実装できるPyCaretをご紹介します。 PyCaretとは 実装プロセスの全体像 データセットの準備 実験環境の設定 機械学習モデルの検討・定義 ハイパーパラメーター調整 未知データの…

【大人気!?】GFPGANで人物画像を鮮明にしてみた

GFPGANについて さっそく試してみた 1.Preparations 2.Upload Images / Use the demo images 3. Inference 補足: resultsの中身 4. Visualize まとめ 参考文献 こんにちは! 皆さんは技術トレンドをチェックしたりしているでしょうか。僕は技術トレンドを把…