CNN vs Vision Transformer 強み弱み 比較解説
Вставка
- Опубліковано 13 жов 2024
- 画像処理用のニューラルネットワークの2大アーキテクチャ、CNNとVisionTransformerを比較します。最近の技術についても紹介します。
どちらが強いかの判定もします(私の独断と偏見です。詳細内容の正しさはご容赦ください)
<出展>
・Masked Autoencoder:
arxiv.org/abs/...
・Swin-Transformer:
arxiv.org/abs/...
・CNNとVisionTransformerの融合(CoAtNet):
arxiv.org/abs/...
・高速なVisionTransformer(EfficientViT):
arxiv.org/abs/...
#ディープラーニング
#画像処理
#トランスフォーマー
#CNN
#transformer
#vit
#computervision
#deeplearning
万能な単一技術はないので、うまい組み会わせがポイントになるのですね。