Vous faites peut-être référence au papier "ResNet strikes back" de 2021 ? Pour la tâche limitée de classification / Imagenet c'était effectivement le cas, mais depuis des architectures type MetaFormer, ou mixé Conv / Attention font sensiblement mieux. Sinon pour la tâche plus généraliste d'extraction de features visuelles, ce sont les Transformers qui sont largement utilisés, entrainés avec des datasets beaucoup plus conséquents qu'Imagenet.
@@CNRS-FIDLE Merci de votre retour. Pardon, je parlais en fait du convnext pas du resnext. Je viens de retrouver le papier dont je parlais: "A ConvNet for the 2020s" de Z. Liu et al. Apparemment ils en ont fait une suite: "ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders" début 2023, que je n'ai pas encore lu.
Ah d'accord oui ConvNext fait effectivement un meilleur score sur Imagenet Top-1 par rapport aux résultats originaux de ViT avec des modèles équivalents en taille. Cependant vous pouvez voir sur paperwithcode que le haut du tableau est occupé par des modèles avec une base VisionTransformer.
vraiment trés interessant, à 43 ans et j'apprend avec vous
Merci beaucoup, notre objectif est que le Deep Learning soit accessible de 7 à 77 ans :-)
Excellente explication ! Très bon travail.
Merci pour cette excellente présentation.
Merci beaucoup pour ce retour !
Très bien expliqué. Je suis allé lire cette Article, c'est très intéressant.
Merci beaucoup :-)
Pour l'image les resnext ne sont plus aussi bon que les transformers? Il y a deux ou trois ans, un papier disait que les resnext faisaient aussi bien
Vous faites peut-être référence au papier "ResNet strikes back" de 2021 ? Pour la tâche limitée de classification / Imagenet c'était effectivement le cas, mais depuis des architectures type MetaFormer, ou mixé Conv / Attention font sensiblement mieux. Sinon pour la tâche plus généraliste d'extraction de features visuelles, ce sont les Transformers qui sont largement utilisés, entrainés avec des datasets beaucoup plus conséquents qu'Imagenet.
@@CNRS-FIDLE Merci de votre retour. Pardon, je parlais en fait du convnext pas du resnext. Je viens de retrouver le papier dont je parlais: "A ConvNet for the 2020s" de Z. Liu et al.
Apparemment ils en ont fait une suite: "ConvNeXt V2: Co-designing and Scaling ConvNets with Masked Autoencoders" début 2023, que je n'ai pas encore lu.
Ah d'accord oui ConvNext fait effectivement un meilleur score sur Imagenet Top-1 par rapport aux résultats originaux de ViT avec des modèles équivalents en taille. Cependant vous pouvez voir sur paperwithcode que le haut du tableau est occupé par des modèles avec une base VisionTransformer.