DeepSeek-R1 łączące AI i obliczenia krawędziowe dla IoT przemysłowego

Wstęp

Niewielkie destylowane modele DeepSeek-R1 są dopracowane przy użyciu danych przemytnych generowanych przez DeepSeek-R1, oznaczone...Tagi, dziedziczenie możliwości rozumowania R1. Te dopracowane zestawy danych wyraźnie obejmują procesy rozumowania, takie jak rozkład problemów i odliczenia pośrednie. Uczenie się wzmocnienia wyrównało wzorce zachowania modelu destylowanego z etapami rozumowania wygenerowanymi przez R1. Ten mechanizm destylacji pozwala małym modelom na utrzymanie wydajności obliczeniowej przy jednoczesnym uzyskiwaniu złożonych zdolności rozumowania w pobliżu większych modeli, co ma znaczącą wartość zastosowania w scenariuszach ograniczonych zasobami. Na przykład wersja 14B osiąga 92% ukończenia kodu oryginalnego modelu Deepseek-R1. W tym artykule wprowadzono model destylowany DeepSeek-R1 i jego podstawowe zastosowania w przetwarzaniu krawędzi przemysłowej, podsumowane w następujących czterech kierunkach, wraz z konkretnymi przypadkami wdrażania:

DC3C637C5BEAD8B62ED51B6D83AC0B4

Przewidywalna konserwacja sprzętu

Wdrożenie techniczne

Fuzja czujnika:

Zintegruj dane wibracji, temperatury i bieżących z PLC za pomocą protokołu Modbus (szybkość próbkowania 1 kHz).

Ekstrakcja funkcji:

Impuls Edge Edge na Jetson Orin NX, aby wyodrębnić 128-wymiarowe funkcje szeregów czasowych.

Wnioskowanie modelu:

Wdrażaj model DeepSeek-R1-Distill-14B, wprowadzając wektory funkcji w celu wygenerowania wartości prawdopodobieństwa.

Dynamiczna regulacja:

Wywołuj prace konserwacyjne, gdy zaufanie> 85%, i inicjują wtórny proces weryfikacji, gdy <60%.

Odpowiedni przypadek

Schneider Electric wdrożył to rozwiązanie na maszynach górniczych, zmniejszając stawki fałszywie dodatnie o 63% i koszty utrzymania o 41%.

1

Uruchomienie Model destylowany Deepseek R1 na komputerach Inhand AI Edge

Ulepszona kontrola wizualna

Architektura wyjściowa

Typowy rurociąg wdrażania:

camera = gige_vision_camera (500 fps) # Gigabit Industrial Camera
ramka = camera.capture () # przechwytywanie obrazu
Preprocessed = opencv.denoise (ramka) # denoising preprocessing
defect_type = Deepseek_r1_7b.infer (wstępnie przetworzone) # klasyfikacja defektów
Jeśli defect_type! = „Normal”:
Plc.Trigger_reject () # Mechanizm sortowania wyzwalania

Wskaźniki wydajności

Opóźnienie przetwarzania:

82 MS (Jetson Agx Orin)

Dokładność:

Wykrywanie defektów uformowanej wtrysku osiąga 98,7%.

2

Implikacje Deepseek R1: Zwycięzcy i przegrani w łańcuchu wartości generatywnych AI

Optymalizacja przepływu procesu

Kluczowe technologie

Interakcja języka naturalnego:

Operatorzy opisują anomalie urządzeń głosem (np. „Fluktuacja ciśnienia wytłaczania ± 0,3 MPa”).

Rozumowanie multimodalne:

Model generuje sugestie optymalizacji na podstawie danych historycznych sprzętu (np. Regulacja prędkości śruby o 2,5%).

Cyfrowa weryfikacja bliźniaczy:

Walidacja symulacji parametrów na platformie Edgex Foundry.

Efekt wdrażania

Zakład chemiczny BASF przyjął ten schemat, osiągając 17% zmniejszenie zużycia energii i 9% wzrost jakości produktu.

3

Edge AI and the Future of Business: Openai O1 vs. Deepseek R1 dla opieki zdrowotnej, motoryzacyjnej i IIOT

Natychmiastowe pobieranie bazy wiedzy

Projekt architektury

Lokalna baza danych wektorów:

Użyj chromadb do przechowywania instrukcji wyposażenia i specyfikacji przetwarzania (osadzanie wymiaru 768).

Hybrydowe wyszukiwanie:

Połącz algorytm BM25 + podobieństwo cosinusu dla zapytania.

Generowanie wyników:

Model R1-7B podsumowuje i udoskonala wyniki pobierania.

Typowy przypadek

Inżynierowie Siemens rozwiązali awarie falownika poprzez zapytania dotyczące języka naturalnego, skracając średni czas przetwarzania o 58%.

Wyzwania i rozwiązania wdrażania

Ograniczenia pamięci:

Wykorzystano technologię kwantyzacji pamięci podręcznej KV, zmniejszając zużycie pamięci modelu 14B z 32 GB do 9 GB.

Zapewnienie wydajności w czasie rzeczywistym:

Stabilizowane opóźnienie pojedynczego wnioskowania do ± 15 ms poprzez optymalizację wykresu CUDA.

Drift Model:

Cotygodniowe aktualizacje przyrostowe (przesyłanie tylko 2% parametrów).

Ekstremalne środowiska:

Zaprojektowany dla szerokich zakresów temperatur -40 ° C do 85 ° C z poziomem ochrony IP67.

5
微信图片 _20240614024031.jpg1

Wniosek

Obecne koszty wdrażania spadły obecnie do 599 USD/węzeł (Jetson Orin NX), z skalowalnymi aplikacjami tworzącymi się w sektorach takich jak produkcja 3C, montaż motoryzacyjny i chemia energii. Oczekuje się, że ciągła optymalizacja technologii architektury i kwantyzacji MOE umożliwią uruchomieniu modelu 70B na urządzeniach krawędzi do końca 2025 r.

Znajdź roztwór elv kabla

Kable kontrolne

Dla BMS, Bus, przemysłowy, oprzyrządowania.

Strukturowany system okablowania

Sieć i dane, kabel światłowodowy, sznur łaty, moduły, płyta czołowa

2024 Przegląd wystaw i wydarzeń

16 kwietnia-8, 2024 Energia Bliskiego Wschodu w Dubaju

16 kwietnia do 8, 2024 Securika w Moskwie

9 maja, 2024 Nowe wydarzenie Products & Technologies Wprowadzenie w Szanghaju

22 października-25., 2024 Bezpieczeństwo Chiny w Pekinie

19 listopada, 2024 Connected World KSA


Czas postu: lutego-07-2025