tkherox blog

データサイエンスおよびソフトウェア開発、たまに育児についての話を書いています

2021-01-01から1年間の記事一覧

SHAPの各種可視化プロットを日本語化する

今回の記事は備忘録も兼ねて軽めの内容を記載していきます. はじめに 実行環境 問題 対策 まとめ はじめに 機械学習のモデル解釈で頻繁に用いられるのがSHAPです. 実際のデータ分析の現場で頻繁に用いられるライブラリとしては shap があります. github.c…

flowWeaverでSankey Diagramの可視化

今回は可視化の記事についてです. Sankey Diagramとは floWeaver 実行環境 インストール floWeaverの実装方法 データ 可視化 まとめ 参考資料 Sankey Diagramとは SanKey Diagramとは各プロセス間の流量を表現する可視化パターンです.矢印の向きでプロセス…

『ソフトウェア・ファースト』を読んでみて

今回は読んだ書籍について私なりの意見を記載していこうと思います. 本の選定 読了した後の考え方の変化 ソフトウェアの過小評価 マネージャーの在り方 主役は現場社員 10X思考 全員がプロダクト志向 まとめ 本の選定 社内人になってライフステージも変化し…

CLIアプリケーションのためのTyper

Typerとは インストール 使い方・実装方法 CLI Arguments CLI Options SubCommand まとめ 参考資料 Typerとは TyperはCLIアプリケーションを作成するためのライブラリです. github.com Typerの特徴は大きく以下になります. 直感的なコーディング 使いやす…

データ分析におけるキャリブレーション

キャリブレーションとは クラス分類におけるキャリブレーション キャリブレーションの評価指標 Reliability Diagram Expected Calibration Error(ECE) Maximum Calibration Error(MCE) キャリブレーション方法 Isotonic Regression Platt Scaling キャリブレ…

matplotlibの文字化け解決の最適解『japanize-matplotlib』

matplotlibの文字化け 対処法 japanize-matplotlib まとめ matplotlibの文字化け データ分析を行なっている方であれば当然EDA(探索的データ分析)のフェーズで自身が扱っているデータを理解することに努めると思います.このプロセスを丁寧に行うことで「扱っ…

令和2年秋季応用情報技術者試験の受験結果は...

経緯 受験結果 次の試験に向けて まとめ 経緯 過去の記事で「応用情報技術者試験に合格するまで」というタイトルで内容を記載しています. その中で令和2年秋季の応用情報技術者試験の受験報告と自己採点を記載したのですが,正式な受験結果を記載していなか…

データ分析でもアルゴリズム『いもす法』

はじめに 『いもす法』ってなんぞや Pythonでの実装例 まとめ はじめに データサイエンスを日常的に行う中で大量のデータを扱うことが往々にしてあります.その際に頻繁に発生してくる問題が膨大な計算量による待ち時間発生や計算が有限時間内に終了しないと…

Pytorchにおけるモデル保存の使い分け

はじめに モデル保存パターン 各パターンの解説 state_dictのモデル保存 entireのモデル保存 TorchScriptのモデル保存 べストな保存方法 まとめ はじめに TorchServeを利用してサービングを実施する際にモデルの保存方法についていくつかパターンがあり,Tor…

TorchServe入門

TorchServeとは アーキテクチャ メリット 事前準備 利用データ インストール TorchServe実践 モデル作成 デプロイ 推論リクエスト まとめ TorchServeとは TorchServeはPytorchで構築したモデルをサービングするためのモデルサービングライブラリです. AWSと…