
2026-02-03
С постепенным переходом крупных моделей, таких как DeepSeek и Qwen, на открытый исходный код, эти системы претерпевают глубокую «демократизацию». Миф о облачных технологиях ищет ответы на местах — когда интеллект должен появляться в режиме реального времени на городских дорогах, в уголках кампусов и на производственных линиях заводов, мы сталкиваемся с крайне сложной задачей обеспечения баланса между огромными объемами данных, строгими требованиями к задержке и ограниченным энергопотреблением. Специализированные решения для пограничных вычислений стали ключевыми для крупномасштабного развертывания этих моделей. Воспользовавшись этой тенденцией, мы представили несколько решений для пограничных вычислений, достигнув тонкого баланса между широтой и глубиной интеллектуальной реализации.
Часть 1: Использование вычислительных мощностей, открытие новых возможностей
Открытые инновации в области полупроводников
К 2025 году, когда ведущие модели, такие как DeepSeek и Tongyi Qianwen, станут открытыми, внимание отрасли сместится с «конкуренции по масштабу» на «скорость развертывания». По мере перехода интеллекта из облака на периферию мы прокладываем этот последний путь с помощью надежной вычислительной базы.
1.Постоянная адаптация моделей CNN с открытым исходным кодом для создания легких крупномасштабных мультимодальных (L2M2) приложений для развертывания в сценариях.
2.Адаптация основных крупных моделей периферии, включая ChatGLM | Llama | Qwen | MiniCPM | DeepSeek, с открытым исходным кодом всего кода развертывания.
3.Помощь партнерам в реализации сценариев «видео/аудио + ИИ», расширение интерактивных границ интеллекта на периферии.
Часть 2: Адаптация нескольких моделей и глубокая оптимизация
Мы углубились в основные архитектуры моделей с открытым исходным кодом, добившись всесторонней совместимости и прорыва в производительности традиционных моделей CNN, крупных языковых моделей и крупных мультимодальных моделей. Что особенно важно, мы воплотили эти возможности глубокой оптимизации в стандартизированный набор высокопроизводительных аппаратных продуктов для периферийного ИИ. Это превращает развертывание моделей на периферии из сложной инженерной задачи в эффективный, надежный и стандартизированный процесс.
1.Полная матрица адаптации моделей
(1).Визуальные модели
| Инспекция
|
YOLOv34 | YOLOv5 | YOLOv7 | YOLOv10
YOLOX | YOLO_world |
| YOLOv8_det | YOLOv9_det | YOLOv11_det
YOLOv12_det |
|
| YOLOv5_opt | YOLOv5_fuse | |
| YOLOv8_obb | YOLOv11_obb | |
| YOLOv8_pose | OpenPose | HRNet_pose | |
| ppYOLOv3 | ppYoloe | |
| SSD | D-FINE | |
| RetinaFace | SCRFD | |
| DirectMHP | |
| Идентификация
|
LPRNet | PP-OCR |
| CenterNet | |
| C3D | SlowFast | |
| P2PNet | |
| Классификация
|
ResNet | Recognize-Anything | YOLOv8_plus_cls |
| CLIP | SuperGlue | LightStereo | |
| Разделение
|
P2PNet |
| segformer | SAM | SAM2 | |
| yolact | YOLOv8_plus_seg | YOLOv8_plus_seg_fuse
YOLOv9_seg |
|
| Генерировать
|
StableDiffusionV1.5 | StableDiffusionXL | FLUX.1 |
| Real-ESRGAN | |
| Отслеживание
|
DeepSORT |
| ByteTrack |
(2).Аудио модель
| Тип
|
Модель
|
| Идентификация
|
WeNet |
| Whisper | |
| Seamless | |
| CAM++ | |
| оптимизировать
|
FaceFormer |
| MP_SENet | |
| Генерировать
|
VITS_CHINESE |
| ChatTTS |
(3).Большая языковая модель
| Тип
|
Модель
|
| Серия чатов
|
ChatGLM2 | ChatGLM3 | ChatGLM4 |
| Серия Qwen
|
Qwen-7b
Qwen1.5-1.8B | Qwen1.5-7B Qwen2-7b Qwen2.5-0.5B | Qwen2.5-1.5B | Qwen2.5-3B | Qwen2.5-7B Qwen3-0.6B | Qwen3-1.7B | Qwen3-4B | Qwen3-7B |
| QwQ-32B | |
| Серия DeepSeek
|
deepseek-r1-distill-qwen-1.5b
deepseek-r1-distill-qwen-7b |
| deepseek-r1-distill-qwen2-1.5b
deepseek-r1-distill-qwen2-7b deepseek-r1-distill-qwen2-14b |
|
| Серия Mini CPM
|
MiniCPM | MiniCPM3 | MiniCPM4 |
(4).Мультимодальная большая модель
| Тип
|
Модель
|
| Серия Qwen
|
Qwen-VL-Chat
Qwen2-VL | Qwen2.5-VL-3B | Qwen2.5-VL-7B Qwen3-VL-2B | Qwen3-VL-4B | Qwen3-VL-8B |
| Серия стажировок
|
InternVL2 | InternVL3-2B | InternVL3-8B |
| Другое
|
Vila | Llama3_2_Vision | MiniCPMV-4B
GroundingDINO | Phi4mm | VITA1_5 | BLIP |
2.Глубокая оптимизация для надежной работы
Возможности адаптации LLM
Адаптивная производительность VLM
Вычислительная мощность как основа, развитие экосистемы сотрудничества
1.Продукт с визуальной моделью: интегрированный блок для круглосуточного и всестороннего восприятия
Интегрированный блок для круглосуточного и всестороннего восприятия служит цифровой инфраструктурой для интеллектуальных объектов, объединяя восприятие, зондирование, вычисления, определение и безопасность. Функционируя в качестве «базовой станции цифрового интеллекта» для городских интеллектуальных объектов, он широко используется в таких системах, как фонарные столбы, уличные шкафы и коммунальные оборудовательные помещения.
2.Применение аудиомодели: микрофон для записи разговоров
Обеспечивает высокоточную транскрипцию речи в режиме реального времени, поддерживая индивидуальное распознавание малоизвестных терминов. Оснащен функциями полнотекстовой транскрипции и оповещения по ключевым словам. Подходит для сценариев, требующих транскрипции аудиозаписей, таких как судебные допросы или запись учебного процесса.
3.AI NAS: флагманское приложение больших языковых моделей.
Поддерживает конфигурации от 2 до 6 отсеков для дисков, с сопутствующими платформами управления для мобильных устройств (Android и iOS), ПК и телевизоров. Обеспечивает централизованное управление всеми домашними IP-камерами и функцию текстового поиска по разговорам: ИИ автоматически классифицирует людей и сцены, позволяя выполнять запросы на файлы и фотографии на естественном языке. Задачи обрабатываются автоматически через ИИ-агента, который служит личным помощником в каждом доме.
4.Типичный продукт для применения мультимодальных крупных моделей — интеллектуальный аналитический хост
Хост для пограничных вычислений, объединяющий доступ к IPC, хранение, управление, интеллектуальный анализ и интеллектуальное отображение. Он обеспечивает интеллектуальный поиск по тексту, поиск по изображениям, точный анализ целей, защиту периметра и структурированный анализ видео для людей/транспортных средств.
Посвященные вычислениям, приверженные будущему
В течение последнего года мы неуклонно создавали основу для вычислительных чипов, одновременно усердно продвигая нашу миссию по расширению возможностей различных отраслей. Наш комплексный портфель продуктов для пограничных вычислений обеспечивает прочную основу для внедрения промышленной интеллектуальной системы. От основного вычислительного оборудования до программных инструментов с открытым исходным кодом, от флагманских универсальных продуктов до отраслевых решений, созданных совместно с партнерами по экосистеме, мы идем рука об руку с различными отраслями, преобразуя интеллектуальную вычислительную мощность в ощутимую производительность и инновации в различных секторах.