データ分析おじさん

未分類

Pytorchで画像2クラス分類(転移学習)

過去にKerasを利用した画像2クラス分類の転移学習コードを公開しましたが、開発をPytorchに移行したため、いつ・どこからでも参照できるようにブログ上にPytorch版を公開しておきます。 本ページではVGG16を利用した転移学...
開発

RuffでPythonコードの品質を楽に底上げする

Ruffとは Ruff は Python の リンター(バグの芽やコード規約違反の検出)と フォーマッタ(整形)を ひとつにまとめた高速なコード品質改善ツールです。Rustで実装されているので動作がキビキビしており、未使用インポート...
開発

uv入門

「pip と venv を毎回作って管理するのめんどくさいなあ」と思っている方にぜひ読んでもらいたい内容です。さらにおまけとして「PyTorch の GPU 版を uv で入れる方法」も最後に記載しております。 uv...
未分類

uvによるPython環境構築・パッケージ管理入門

こんにちは、データ分析おじさんです。今日は最近話題の Python 環境管理ツール uv を触ってみた話を書きます。 「pip と venv を毎回作って管理するのめんどくさいなあ」と思っている方にぜひ読んでもらいたい内容です。さら...
雑記

2025年版:データサイエンティスト向け資格まとめ

こんにちは、データ分析おじさんです。先日、データサイエンティスト脂肪の若い学生さんお話する機会がありまして、「資格ってぶっちゃけどうなんですか?」という話題に。実務で成果が出せれば資格はマストじゃない一方で、若手で転職考えてたり職...
未分類

書評:先輩データサイエンティストからの指南書

先輩データサイエンティストからの指南書―実務で生き抜くためのエンジニアリングスキル 著者浅野純季,木村真也,田中冬馬,武藤克大,栁泉穂 著 発売日2025.8.27判型A5頁数240ページISBN978-4-297-151...
未分類

Linear Probing

Masked Autoencoders Are Scalable Vision Learners を読んでいたら見かけた記述。 ​自己教師あり学習(Self-Supervised Learning)の分野では、モデルが学習した特徴表...
書評

短書評一覧

比較的短めな書評ページ FACTFULLNESS FACTFULNESS10の思い込みを乗り越え、データを基に世界を正しく見る習慣 発行:2019年1月15日 第1版第1刷著者:ハンス・ロスリング 人は悲観...
python

pandas: 欠損値割合を指定して列を削除する

python-pandasを用いた前処理を実施する際に,欠損率XX%を超える列を削除する方法について。 結論 自前で処理を作成するパターンと,pandas.DataFrame.dropnaメソッドの”thresh”を設定するパ...
分類

Tensorflow Keras: 2値分類 実装例

Tensorflow Keras を利用した深層学習(Deep Learning)2値分類モデルの単純な実装例について,常に参照できるように備忘録として示す。モデル構築の実装例を可能な限りシンプルに示すため,入力データの前処理やハイパーパ...