Xử lý ảnhCác mô hình Học Sâu (Deep Learning)Kiến trúc & Mô hình nền tảngVision Transformers (ViT, Swin Transformer...)Vision Transformers (ViT, Swin Transformer...)Kiến trúc cơ sở (CNN Backbones: ResNet, EfficientNet...)Vision-Language Models (VLM: CLIP, BLIP, LLaVA...)Bình luận & Cảm xúc