Blog Onlyfan
GitHubGitHub (opens in a new tab)
  • Home
  • 🚩 Chào mừng
    • Lý thuyết & Thuật toán
      • Thuật toán điều khiển
        • Thuật toán điều khiển PID
        • Thuật toán Dynamic Movement Primitives (DMP)
      • Visual Slam
        • Visual Odometry
    • Phần mềm & Nền tảng
      • Robot Operating System - ROS
        • ROS 1
          • Hướng dẫn nhanh về ROS 1
            • Cài đặt ROS 1
              • Cài đặt ROS 1 thủ công
              • Chạy ROS 1 qua docker
        • ROS 2
          • Hướng dẫn nhanh về ROS2
            • Cài đặt ROS 2
              • Cài đặt ROS 2 thủ công
    • Các hệ thống Robot
      • Turtle Bot 4
      • Ur3
        • Thao tác với Robot thực tế (Real Hardware)
          • Setup đầu để kết nối điều khiển Ur3 qua python-websocket
        • Mô phỏng UR3 (Simulation)
          • Cài đặt môi trường mô phỏng UR3
    • Các mô hình Học Sâu (Deep Learning)
      • Kiến trúc & Mô hình nền tảng
        • Kiến trúc cơ sở (CNN Backbones: ResNet, EfficientNet...)
        • Vision Transformers (ViT, Swin Transformer...)
        • Vision-Language Models (VLM: CLIP, BLIP, LLaVA...)
      • Các bài toán thị giác máy
        • Phân loại ảnh (Image Classification)
        • Phát hiện đối tượng (Object Detection)
        • Theo dõi đối tượng (Object Tracking)
        • Phân vùng ảnh (Image Segmentation)
        • Phát hiện bất thường (Anomaly Detection)
          • Padim - Patch Distribution Modeling
          • PatchCore
    • Một vài thuật toán xử lý ảnh cổ điển
      • Đặc trưng (feature)
        • Orb
    • Mô hình ngôn ngữ lớn (Large language models - LLM)
      • RAG (Retrieval-Augmented Generation)
        • Tổng quan
        • Vector Embeddings / Work Embeddings
    • Có những gì ở đây ?
    • Lý thuyết trò chơi
    • Django
      • Viết ứng dụng Django đầu tiên của bạn.
        • Hướng dẫn cài đặt
        • Khởi tạo dự án Django
Xử lý ảnh
Các mô hình Học Sâu (Deep Learning)
Kiến trúc & Mô hình nền tảng
Vision Transformers (ViT, Swin Transformer...)

Vision Transformers (ViT, Swin Transformer...)

Kiến trúc cơ sở (CNN Backbones: ResNet, EfficientNet...)Vision-Language Models (VLM: CLIP, BLIP, LLaVA...)

Bình luận & Cảm xúc