Новая парадигма для Edge Intelligence

2026-02-03

С постепенным переходом крупных моделей, таких как DeepSeek и Qwen, на открытый исходный код, эти системы претерпевают глубокую «демократизацию». Миф о облачных технологиях ищет ответы на местах — когда интеллект должен появляться в режиме реального времени на городских дорогах, в уголках кампусов и на производственных линиях заводов, мы сталкиваемся с крайне сложной задачей обеспечения баланса между огромными объемами данных, строгими требованиями к задержке и ограниченным энергопотреблением. Специализированные решения для пограничных вычислений стали ключевыми для крупномасштабного развертывания этих моделей. Воспользовавшись этой тенденцией, мы представили несколько решений для пограничных вычислений, достигнув тонкого баланса между широтой и глубиной интеллектуальной реализации.

Часть 1: Использование вычислительных мощностей, открытие новых возможностей

Открытые инновации в области полупроводников

К 2025 году, когда ведущие модели, такие как DeepSeek и Tongyi Qianwen, станут открытыми, внимание отрасли сместится с «конкуренции по масштабу» на «скорость развертывания». По мере перехода интеллекта из облака на периферию мы прокладываем этот последний путь с помощью надежной вычислительной базы.

1.Постоянная адаптация моделей CNN с открытым исходным кодом для создания легких крупномасштабных мультимодальных (L2M2) приложений для развертывания в сценариях.

2.Адаптация основных крупных моделей периферии, включая ChatGLM | Llama | Qwen | MiniCPM | DeepSeek, с открытым исходным кодом всего кода развертывания.

3.Помощь партнерам в реализации сценариев «видео/аудио + ИИ», расширение интерактивных границ интеллекта на периферии.

Часть 2: Адаптация нескольких моделей и глубокая оптимизация

Мы углубились в основные архитектуры моделей с открытым исходным кодом, добившись всесторонней совместимости и прорыва в производительности традиционных моделей CNN, крупных языковых моделей и крупных мультимодальных моделей. Что особенно важно, мы воплотили эти возможности глубокой оптимизации в стандартизированный набор высокопроизводительных аппаратных продуктов для периферийного ИИ. Это превращает развертывание моделей на периферии из сложной инженерной задачи в эффективный, надежный и стандартизированный процесс.

1.Полная матрица адаптации моделей

(1).Визуальные модели

Инспекция	YOLOv34 \| YOLOv5 \| YOLOv7 \| YOLOv10 YOLOX \| YOLO_world
	YOLOv8_det \| YOLOv9_det \| YOLOv11_det YOLOv12_det
	YOLOv5_opt \| YOLOv5_fuse
	YOLOv8_obb \| YOLOv11_obb
	YOLOv8_pose \| OpenPose \| HRNet_pose
	ppYOLOv3 \| ppYoloe
	SSD \| D-FINE
	RetinaFace \| SCRFD
	DirectMHP
Идентификация	LPRNet \| PP-OCR
	CenterNet
	C3D \| SlowFast
	P2PNet
Классификация	ResNet \| Recognize-Anything \| YOLOv8_plus_cls
Классификация	CLIP \| SuperGlue \| LightStereo
Разделение	P2PNet
	segformer \| SAM \| SAM2
	yolact \| YOLOv8_plus_seg \| YOLOv8_plus_seg_fuse YOLOv9_seg
Генерировать	StableDiffusionV1.5 \| StableDiffusionXL \| FLUX.1
Генерировать	Real-ESRGAN
Отслеживание	DeepSORT
Отслеживание	ByteTrack

(2).Аудио модель

Тип	Модель
Идентификация	WeNet
	Whisper
	Seamless
	CAM++
оптимизировать	FaceFormer
оптимизировать	MP_SENet
Генерировать	VITS_CHINESE
Генерировать	ChatTTS

(3).Большая языковая модель

Тип

Модель

Серия чатов

ChatGLM2 | ChatGLM3 | ChatGLM4

Серия Qwen

Qwen-7b

Qwen1.5-1.8B | Qwen1.5-7B

Qwen2-7b

Qwen2.5-0.5B | Qwen2.5-1.5B | Qwen2.5-3B | Qwen2.5-7B

Qwen3-0.6B | Qwen3-1.7B | Qwen3-4B | Qwen3-7B

QwQ-32B

Серия DeepSeek

deepseek-r1-distill-qwen-1.5b

deepseek-r1-distill-qwen-7b

deepseek-r1-distill-qwen2-1.5b

deepseek-r1-distill-qwen2-7b

deepseek-r1-distill-qwen2-14b

Серия Mini CPM

MiniCPM | MiniCPM3 | MiniCPM4

(4).Мультимодальная большая модель

Тип

Модель

Серия Qwen

Qwen-VL-Chat

Qwen2-VL | Qwen2.5-VL-3B | Qwen2.5-VL-7B

Qwen3-VL-2B | Qwen3-VL-4B | Qwen3-VL-8B

Серия стажировок

InternVL2 | InternVL3-2B | InternVL3-8B

Другое

Vila | Llama3_2_Vision | MiniCPMV-4B

GroundingDINO | Phi4mm | VITA1_5 | BLIP

2.Глубокая оптимизация для надежной работы

Возможности адаптации LLM

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (5)

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (6)

Адаптивная производительность VLM

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами777 (1)

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами777 (2)

Вычислительная мощность как основа, развитие экосистемы сотрудничества

1.Продукт с визуальной моделью: интегрированный блок для круглосуточного и всестороннего восприятия

Интегрированный блок для круглосуточного и всестороннего восприятия служит цифровой инфраструктурой для интеллектуальных объектов, объединяя восприятие, зондирование, вычисления, определение и безопасность. Функционируя в качестве «базовой станции цифрового интеллекта» для городских интеллектуальных объектов, он широко используется в таких системах, как фонарные столбы, уличные шкафы и коммунальные оборудовательные помещения.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (1)

2.Применение аудиомодели: микрофон для записи разговоров

Обеспечивает высокоточную транскрипцию речи в режиме реального времени, поддерживая индивидуальное распознавание малоизвестных терминов. Оснащен функциями полнотекстовой транскрипции и оповещения по ключевым словам. Подходит для сценариев, требующих транскрипции аудиозаписей, таких как судебные допросы или запись учебного процесса.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (2)

3.AI NAS: флагманское приложение больших языковых моделей.

Поддерживает конфигурации от 2 до 6 отсеков для дисков, с сопутствующими платформами управления для мобильных устройств (Android и iOS), ПК и телевизоров. Обеспечивает централизованное управление всеми домашними IP-камерами и функцию текстового поиска по разговорам: ИИ автоматически классифицирует людей и сцены, позволяя выполнять запросы на файлы и фотографии на естественном языке. Задачи обрабатываются автоматически через ИИ-агента, который служит личным помощником в каждом доме.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (3)

4.Типичный продукт для применения мультимодальных крупных моделей — интеллектуальный аналитический хост

Хост для пограничных вычислений, объединяющий доступ к IPC, хранение, управление, интеллектуальный анализ и интеллектуальное отображение. Он обеспечивает интеллектуальный поиск по тексту, поиск по изображениям, точный анализ целей, защиту периметра и структурированный анализ видео для людей/транспортных средств.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (4)

Посвященные вычислениям, приверженные будущему

В течение последнего года мы неуклонно создавали основу для вычислительных чипов, одновременно усердно продвигая нашу миссию по расширению возможностей различных отраслей. Наш комплексный портфель продуктов для пограничных вычислений обеспечивает прочную основу для внедрения промышленной интеллектуальной системы. От основного вычислительного оборудования до программных инструментов с открытым исходным кодом, от флагманских универсальных продуктов до отраслевых решений, созданных совместно с партнерами по экосистеме, мы идем рука об руку с различными отраслями, преобразуя интеллектуальную вычислительную мощность в ощутимую производительность и инновации в различных секторах.

Нет. Следующий

Последние новости