DeepSeek-R1 łączy sztuczną inteligencję i przetwarzanie brzegowe dla przemysłowego Internetu rzeczy

Wstęp

Niewielkie, wyselekcjonowane modele DeepSeek-R1 są precyzyjnie dostrajane przy użyciu danych z łańcucha myśli generowanych przez DeepSeek-R1, oznaczonych...tagi, dziedziczące możliwości rozumowania R1. Te precyzyjnie dostrojone zestawy danych wyraźnie obejmują procesy rozumowania, takie jak dekompozycja problemu i pośrednie dedukcje. Uczenie się przez wzmacnianie dopasowało wzorce zachowań wydestylowanego modelu do kroków rozumowania generowanych przez R1. Ten mechanizm destylacji pozwala małym modelom zachować wydajność obliczeniową, jednocześnie uzyskując złożone zdolności rozumowania zbliżone do tych w większych modelach, co ma znaczącą wartość aplikacyjną w scenariuszach o ograniczonych zasobach. Na przykład wersja 14B osiąga 92% ukończenia kodu oryginalnego modelu DeepSeek-R1. W tym artykule przedstawiono wydestylowany model DeepSeek-R1 i jego główne zastosowania w przemysłowym przetwarzaniu brzegowym, podsumowane w następujących czterech kierunkach, wraz ze szczegółowymi przypadkami implementacji:

dc3c637c5bead8b62ed51b6d83ac0b4

Predykcyjna konserwacja sprzętu

Wdrożenie techniczne

Fuzja czujników:

Integracja danych dotyczących drgań, temperatury i prądu z PLC poprzez protokół Modbus (częstotliwość próbkowania 1 kHz).

Ekstrakcja cech:

Uruchom Edge Impulse w Jetson Orin NX, aby wyodrębnić 128-wymiarowe cechy szeregów czasowych.

Wnioskowanie z modelu:

Wdróż model DeepSeek-R1-Distill-14B, wprowadzając wektory cech w celu wygenerowania wartości prawdopodobieństwa błędu.

Dynamiczna regulacja:

Uruchom zlecenia prac konserwacyjnych, gdy poziom pewności > 85% i zainicjuj proces weryfikacji wtórnej, gdy poziom pewności < 60%.

Odpowiedni przypadek

Firma Schneider Electric wdrożyła to rozwiązanie w maszynach górniczych, co pozwoliło obniżyć liczbę wyników fałszywie dodatnich o 63% i koszty konserwacji o 41%.

1

Uruchamianie modelu DeepSeek R1 Distilled na komputerach brzegowych InHand AI

Ulepszona kontrola wizualna

Architektura wyjściowa

Typowy proces wdrażania:

kamera = GigE_Vision_Camera(500fps) # gigabitowa kamera przemysłowa
frame = camera.capture() # Przechwyć obraz
preprocessed = OpenCV.denoise(frame) # wstępne przetwarzanie odszumiania
defect_type = DeepSeek_R1_7B.infer(preprocessed) # Klasyfikacja defektów
jeśli defekt_type != 'normal':
PLC.trigger_reject() # Mechanizm sortowania wyzwalaczy

Metryki wydajności

Opóźnienie przetwarzania:

82 ms (Jetson AGX Orin)

Dokładność:

Wykrywalność wad form wtryskowych sięga 98,7%.

2

Implikacje DeepSeek R1: Zwycięzcy i przegrani w łańcuchu wartości generatywnej sztucznej inteligencji

Optymalizacja przepływu procesów

Kluczowe technologie

Interakcja języka naturalnego:

Operatorzy opisują anomalie występujące w sprzęcie za pomocą głosu (np. „Wahania ciśnienia wytłaczarki ±0,3 MPa”).

Rozumowanie multimodalne:

Model generuje sugestie optymalizacji w oparciu o historyczne dane dotyczące sprzętu (np. dostosowanie prędkości ślimaka o 2,5%).

Weryfikacja cyfrowego bliźniaka:

Walidacja symulacji parametrów na platformie EdgeX Foundry.

Efekt wdrożenia

Zakłady chemiczne BASF wdrożyły ten schemat, co pozwoliło na redukcję zużycia energii o 17% i poprawę jakości produktów o 9%.

3

Edge AI i przyszłość biznesu: OpenAI o1 kontra DeepSeek R1 dla sektora opieki zdrowotnej, motoryzacji i IIoT

Natychmiastowe pobieranie bazy wiedzy

Projektowanie architektoniczne

Lokalna baza danych wektorów:

Użyj ChromaDB do przechowywania instrukcji obsługi sprzętu i specyfikacji procesów (osadzając wymiar 768).

Pobieranie hybrydowe:

Połącz algorytm BM25 i podobieństwo cosinusowe w celu wykonania zapytania.

Generowanie wyników:

Model R1-7B podsumowuje i udoskonala wyniki wyszukiwania.

Typowy przypadek

Inżynierowie firmy Siemens rozwiązywali problemy z awariami falowników za pomocą zapytań w języku naturalnym, co pozwoliło skrócić średni czas przetwarzania o 58%.

Wyzwania i rozwiązania wdrożeniowe

Ograniczenia pamięci:

Wykorzystano technologię kwantyzacji pamięci podręcznej KV, co pozwoliło na zmniejszenie wykorzystania pamięci w modelu 14B z 32 GB do 9 GB.

Zapewnienie wydajności w czasie rzeczywistym:

Ustabilizowano opóźnienie pojedynczego wnioskowania na poziomie ±15 ms dzięki optymalizacji wykresu CUDA.

Dryf modelu:

Tygodniowe aktualizacje przyrostowe (przesyłające tylko 2% parametrów).

Środowiska ekstremalne:

Zaprojektowane do szerokiego zakresu temperatur od -40°C do 85°C, z poziomem ochrony IP67.

5
微信图片_20240614024031.jpg1

Wniosek

Obecne koszty wdrożenia spadły do ​​599 USD/węzeł (Jetson Orin NX), a skalowalne aplikacje powstają w takich sektorach jak produkcja 3C, montaż samochodów i chemia energetyczna. Oczekuje się, że ciągła optymalizacja architektury MoE i technologii kwantyzacji umożliwi modelowi 70B działanie na urządzeniach brzegowych do końca 2025 r.

Znajdź rozwiązanie ELV Cable

Kable sterujące

Do systemów BMS, BUS, przemysłowych, kabli pomiarowych.

System okablowania strukturalnego

Sieć i dane, Światłowód, Patch Cord, Moduły, Płyta czołowa

Przegląd wystaw i wydarzeń 2024

16-18 kwietnia 2024 r. Middle-East-Energy w Dubaju

16-18 kwietnia 2024 Securika w Moskwie

9 maja 2024 r. WYDARZENIE PREMIERY NOWYCH PRODUKTÓW I TECHNOLOGII w Szanghaju

22-25 października 2024 r. BEZPIECZEŃSTWO CHINY w Pekinie

19-20 listopada 2024 r. CONNECTED WORLD KSA


Czas publikacji: 07-02-2025