从头开始使用Numpy构建卷积神经网络
从零开始使用Numpy构建卷积神经网络
独自でゼロからCNNを構築することでコンピュータビジョンをマスターしましょう

コンピュータビジョンのアプリケーションは現在、私たちの日常生活のあらゆる場所に存在しているため、すべてのデータサイエンスの実践者にとって、その機能原理を理解し、それらに精通することは基本的な要素です。
この記事では、Tensorflow、Pytorch、Kerasなどの人気のある現代のディープラーニングライブラリに頼らずに、ディープニューラルネットワークを構築しました。それから手書きの数字の画像を分類しました。達成した結果は最先端のレベルには達しませんでしたが、それでも満足できるものでした。今度は、Pythonライブラリの Convolutional Neural Network (CNN) を開発するためのさらなる一歩を踏み出すことを目指しています。
Tensorflow、Pytorch、KerasなどのPythonディープラーニングライブラリは非常に強力なツールです。しかし、その一方で、データサイエンスの実践者をニューラルネットワークの低レベルの機能原理を理解することから遮断してしまいます。特にCNNの場合、そのプロセスはクラシックな完全接続ネットワークと比較して直感的でないものです。この問題に対処する唯一の方法は、自分自身でCNNを実装し、実践することです。それがこのタスクの背後にある動機です。
この記事は、包括的なCNNの機能原理ガイドではなく、実践的なガイドとして意図されています。そのため、理論的な部分は簡潔であり、主に実践セクションの理解を支援するために提供されています。そのため、この投稿の最後には豊富なリソースリストがあります。ぜひチェックしてみてください!
- 定义人工通用智能
- 通过与Sandeep Singh一起探索Gen AI的下一个大趋势
- 微软研究院推出Florence-2:一种新颖的视觉基础模型,采用统一的基于提示的表征方法,可用于多种计算机视觉和视觉语言任务
畳み込みニューラルネットワーク
畳み込みニューラルネットワークは、画像分類、物体の位置特定、画像セグメンテーションなどの画像関連タスクに適した特定のアーキテクチャと操作を使用します。そのデザインは、生物学的ニューロンが視覚野の一部にのみ反応する人間の視覚皮質に大まかに似ています。さらに、より高いレベルのニューロンは、より低いレベルのニューロンの出力に反応します。
クラシックな完全接続ネットワークは画像関連のタスクを処理できますが、それらの有効性は…