Новая парадигма для Edge Intelligence

 Новая парадигма для Edge Intelligence 

2026-02-03

С постепенным переходом крупных моделей, таких как DeepSeek и Qwen, на открытый исходный код, эти системы претерпевают глубокую «демократизацию». Миф о облачных технологиях ищет ответы на местах — когда интеллект должен появляться в режиме реального времени на городских дорогах, в уголках кампусов и на производственных линиях заводов, мы сталкиваемся с крайне сложной задачей обеспечения баланса между огромными объемами данных, строгими требованиями к задержке и ограниченным энергопотреблением. Специализированные решения для пограничных вычислений стали ключевыми для крупномасштабного развертывания этих моделей. Воспользовавшись этой тенденцией, мы представили несколько решений для пограничных вычислений, достигнув тонкого баланса между широтой и глубиной интеллектуальной реализации.

 

Часть 1: Использование вычислительных мощностей, открытие новых возможностей

Открытые инновации в области полупроводников

К 2025 году, когда ведущие модели, такие как DeepSeek и Tongyi Qianwen, станут открытыми, внимание отрасли сместится с «конкуренции по масштабу» на «скорость развертывания». По мере перехода интеллекта из облака на периферию мы прокладываем этот последний путь с помощью надежной вычислительной базы.

1.Постоянная адаптация моделей CNN с открытым исходным кодом для создания легких крупномасштабных мультимодальных (L2M2) приложений для развертывания в сценариях.

2.Адаптация основных крупных моделей периферии, включая ChatGLM | Llama | Qwen | MiniCPM | DeepSeek, с открытым исходным кодом всего кода развертывания.

3.Помощь партнерам в реализации сценариев «видео/аудио + ИИ», расширение интерактивных границ интеллекта на периферии.

 

Часть 2: Адаптация нескольких моделей и глубокая оптимизация

Мы углубились в основные архитектуры моделей с открытым исходным кодом, добившись всесторонней совместимости и прорыва в производительности традиционных моделей CNN, крупных языковых моделей и крупных мультимодальных моделей. Что особенно важно, мы воплотили эти возможности глубокой оптимизации в стандартизированный набор высокопроизводительных аппаратных продуктов для периферийного ИИ. Это превращает развертывание моделей на периферии из сложной инженерной задачи в эффективный, надежный и стандартизированный процесс.

1.Полная матрица адаптации моделей

(1).Визуальные модели

Инспекция

 

YOLOv34 | YOLOv5 | YOLOv7 | YOLOv10

YOLOX | YOLO_world

YOLOv8_det | YOLOv9_det | YOLOv11_det

YOLOv12_det

YOLOv5_opt | YOLOv5_fuse
YOLOv8_obb | YOLOv11_obb
YOLOv8_pose | OpenPose | HRNet_pose
ppYOLOv3 | ppYoloe
SSD | D-FINE
RetinaFace | SCRFD
DirectMHP
Идентификация

 

LPRNet | PP-OCR
CenterNet
C3D | SlowFast
P2PNet
Классификация

 

ResNet | Recognize-Anything | YOLOv8_plus_cls
CLIP | SuperGlue | LightStereo
Разделение

 

P2PNet
segformer | SAM | SAM2
yolact | YOLOv8_plus_seg | YOLOv8_plus_seg_fuse

YOLOv9_seg

Генерировать

 

StableDiffusionV1.5 | StableDiffusionXL | FLUX.1
Real-ESRGAN
Отслеживание

 

DeepSORT
ByteTrack

 

(2).Аудио модель

Тип

 

Модель

 

Идентификация

 

WeNet
Whisper
Seamless
CAM++
оптимизировать

 

FaceFormer
MP_SENet
Генерировать

 

VITS_CHINESE
ChatTTS

 

(3).Большая языковая модель

Тип

 

Модель

 

Серия чатов

 

ChatGLM2 | ChatGLM3 | ChatGLM4
Серия Qwen

 

Qwen-7b

Qwen1.5-1.8B | Qwen1.5-7B

Qwen2-7b

Qwen2.5-0.5B | Qwen2.5-1.5B | Qwen2.5-3B | Qwen2.5-7B

Qwen3-0.6B | Qwen3-1.7B | Qwen3-4B | Qwen3-7B

  QwQ-32B
Серия DeepSeek

 

deepseek-r1-distill-qwen-1.5b

deepseek-r1-distill-qwen-7b

  deepseek-r1-distill-qwen2-1.5b

deepseek-r1-distill-qwen2-7b

deepseek-r1-distill-qwen2-14b

Серия Mini CPM

 

MiniCPM | MiniCPM3 | MiniCPM4

 

(4).Мультимодальная большая модель

Тип

 

Модель

 

Серия Qwen

 

Qwen-VL-Chat

Qwen2-VL | Qwen2.5-VL-3B | Qwen2.5-VL-7B

Qwen3-VL-2B | Qwen3-VL-4B | Qwen3-VL-8B

Серия стажировок

 

InternVL2 | InternVL3-2B | InternVL3-8B
Другое

 

Vila | Llama3_2_Vision | MiniCPMV-4B

GroundingDINO | Phi4mm | VITA1_5 | BLIP

 

2.Глубокая оптимизация для надежной работы

Возможности адаптации LLM

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (5)
Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (6)

Адаптивная производительность VLM

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами777 (1)
Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами777 (2)

Вычислительная мощность как основа, развитие экосистемы сотрудничества

1.Продукт с визуальной моделью: интегрированный блок для круглосуточного и всестороннего восприятия

Интегрированный блок для круглосуточного и всестороннего восприятия служит цифровой инфраструктурой для интеллектуальных объектов, объединяя восприятие, зондирование, вычисления, определение и безопасность. Функционируя в качестве «базовой станции цифрового интеллекта» для городских интеллектуальных объектов, он широко используется в таких системах, как фонарные столбы, уличные шкафы и коммунальные оборудовательные помещения.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (1)

2.Применение аудиомодели: микрофон для записи разговоров

Обеспечивает высокоточную транскрипцию речи в режиме реального времени, поддерживая индивидуальное распознавание малоизвестных терминов. Оснащен функциями полнотекстовой транскрипции и оповещения по ключевым словам. Подходит для сценариев, требующих транскрипции аудиозаписей, таких как судебные допросы или запись учебного процесса.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (2)

3.AI NAS: флагманское приложение больших языковых моделей.

Поддерживает конфигурации от 2 до 6 отсеков для дисков, с сопутствующими платформами управления для мобильных устройств (Android и iOS), ПК и телевизоров. Обеспечивает централизованное управление всеми домашними IP-камерами и функцию текстового поиска по разговорам: ИИ автоматически классифицирует людей и сцены, позволяя выполнять запросы на файлы и фотографии на естественном языке. Задачи обрабатываются автоматически через ИИ-агента, который служит личным помощником в каждом доме.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (3)

4.Типичный продукт для применения мультимодальных крупных моделей — интеллектуальный аналитический хост

Хост для пограничных вычислений, объединяющий доступ к IPC, хранение, управление, интеллектуальный анализ и интеллектуальное отображение. Он обеспечивает интеллектуальный поиск по тексту, поиск по изображениям, точный анализ целей, защиту периметра и структурированный анализ видео для людей/транспортных средств.

Новая парадигма для Edge Intelligence когда большие модели встречаются с вычислительными чипами1112 (4)

Посвященные вычислениям, приверженные будущему

В течение последнего года мы неуклонно создавали основу для вычислительных чипов, одновременно усердно продвигая нашу миссию по расширению возможностей различных отраслей. Наш комплексный портфель продуктов для пограничных вычислений обеспечивает прочную основу для внедрения промышленной интеллектуальной системы. От основного вычислительного оборудования до программных инструментов с открытым исходным кодом, от флагманских универсальных продуктов до отраслевых решений, созданных совместно с партнерами по экосистеме, мы идем рука об руку с различными отраслями, преобразуя интеллектуальную вычислительную мощность в ощутимую производительность и инновации в различных секторах.

Главная
Продукция
О Нас
Контакты

Пожалуйста, оставьте нам сообщение

Политика конфиденциальности

Спасибо за использование этого сайта (далее — «мы», «нас» или «наш»). Мы уважаем ваши права и интересы на личную информацию, соблюдаем принципы законности, легитимности, необходимости и целостности, а также защищаем вашу информационную безопасность. Эта политика описывает, как мы обрабатываем вашу личную информацию.

1. Сбор информации
Информация, которую вы предоставляете добровольно: например, имя, номер мобильного телефона, адрес электронной почты и т.д., заполнена при регистрации. Автоматически собирается информация, такая как модель устройства, тип браузера, журналы доступа, IP-адрес и т.д., для оптимизации сервиса и безопасности.

2. Использование информации
предоставлять, поддерживать и оптимизировать услуги веб-сайтов;
верификацию счетов, защиту безопасности и предотвращение мошенничества;
Отправляйте необходимую информацию, такую как уведомления о сервисах и обновления политик;
Соблюдайте законы, нормативные акты и соответствующие нормативные требования.

3. Защита и обмен информацией
Мы используем меры безопасности, такие как шифрование и контроль доступа, чтобы защитить вашу информацию и храним её только на минимальный срок, необходимый для выполнения задачи.
Не продавайте и не сдавайте личную информацию третьим лицам без вашего согласия; Делитесь только если:
Получите своё явное разрешение;
третьим лицам, которым доверено предоставлять услуги (с учётом обязательств по конфиденциальности);
Отвечать на юридические запросы или защищать законные интересы.

4. Ваши права
Вы имеете право на доступ, исправление и дополнение вашей личной информации, а также можете подать заявление на аннулирование аккаунта (после отмены информация будет удалена или анонимизирована согласно правилам). Чтобы реализовать свои права, вы можете связаться с нами, используя контактные данные, указанные ниже.

5. Обновления политики
Любые изменения в этой политике будут уведомлены путем публикации на сайте. Ваше дальнейшее использование услуг означает ваше согласие с изменёнными правилами.