Faydalı məsləhətlər

Superkompüterlər üçün şəbəkələr

Pin
Send
Share
Send
Send


Paylanmış hesablama bəzi maraqlı layihələrə töhfə verməyin bir yoludur. Kompüteriniz boş olduqda, gücünü xaricdən gələn sivilizasiyalar axtaran SETI layihəsi ilə bölüşün. Bu vəziyyətdə kompüteriniz peyk məlumatlarını və teleskoplardan alınan məlumatları təhlil edəcəkdir.

Bu yazı paylanmış hesablama ilə əlaqəli layihələrə (məsələn SETI) qoşulmağa kömək edəcəkdir. Məqalə eyni zamanda paylanmış hesablama proqramı olan BOINC ilə tanış edir.

Sizə kompüter lazımdır. Əgər sizdə artıq varsa, mənbələr və bağlantılar bölməsinə gedin və BOINC proqramını quraşdırın. SETI layihəsi ilə maraqlanmırsınızsa, aşağıda digər layihələrin siyahısını tapa bilərsiniz.

Çox pul varsa

Ayrıca, Intel Xeon LGA1567 soketindəki olduqca bahalı, lakin məhsuldar prosessorların xəttini qeyd edirik.
Bu seriyanın ən yaxşı prosessoru on 2.4 GHz nüvəsi olan E7-8870-dir. Onun qiyməti 4616 dollardır. Belə CPU-lar üçün HP və Supermicro buraxılır! səkkiz prosessor! server şassisi. Səkkiz 10 nüvəli Xeon E7-8870 2.4 GHz prosessorları, HyperThreading dəstəyi ilə Windows Task Manager'də yüz altmış qrafik prosessor yükləmə qrafiki, 10x16 olaraq göstərilən 8 * 10 * 2 = 160 iplik.

Səkkiz prosessorun korpusa uyğun olması üçün dərhal anakarta deyil, anakarta yapışan ayrı lövhələrə yerləşdirilir. Şəkil, anakartda quraşdırılmış prosessorları olan dörd anakartı göstərir (hər biri iki). Bu Supermicro həllidir. HP həllində hər prosessorun öz lövhəsi var. Bir HP həllinin dəyəri prosessorların sayına, yaddaşa və daha çoxuna görə iki ilə üç milyon arasında dəyişir. Supermicro şassisi 10.000 dollara başa gəlir, bu da daha cəlbedicidir. Bundan əlavə, Supermicro PCI-Express x16 portlarına dörd süprosessor genişləndirmə kartı qoya bilər (yeri gəlmişkən, bunların bir çoxluğunu toplamaq üçün İnfiniband adapterinə hələ yer qalacaq), ancaq HP-də yalnız ikisi var. Beləliklə, superkompüter yaratmaq üçün Supermicro-dan səkkiz prosessor platforması daha cəlbedicidir. Sərgidən aşağıdakı fotoşəkildə dörd GPU lövhəsi olan tam superkompüter göstərilir.

Ancaq çox bahadır.

Rabitə şəbəkələri

Bir çox tətbiqetmədə bir super kompüterin effektivliyi əsasən yaddaş və şəbəkə ilə işləmə profilinə görə müəyyən edilir. Yaddaşla işləmə profili adətən zənglərin məkan-müvəqqəti lokalizasiyası ilə xarakterizə olunur - zənglərin ölçüsü və onların ünvanlarının səpələnməsi ilə, şəbəkə ilə işləmə profili mesajların dəyişdirildiyi qovşaqların paylanması, məzənnə və mesaj ölçüləri ilə təsvir olunur.

Düyünlər arasında intensiv məlumat mübadiləsi olan tapşırıqlar (modelləşdirmə problemləri, qrafiklər və nizamsız ızgaralardakı problemlər, seyrək matrislərdən istifadə edilən hesablamalar) bir superkompüterin performansı əsasən şəbəkə performansı ilə müəyyən edilir, buna görə adi kommersiya həllərinin (məsələn, Gigabit Ethernet) istifadəsi son dərəcə təsirsizdir. Bununla birlikdə, real bir şəbəkə həmişə kompromis bir həlldir, onun inkişafında prioritetlər qiymət, performans, enerji istehlakı və əsasən ziddiyyətli digər tələblər arasında qurulur: bir xarakterikliyi yaxşılaşdırmaq cəhdləri digərinin pisləşməsinə səbəb ola bilər.

Bir rabitə şəbəkəsi, hər birində bir və ya daha çox marşrutlaşdırıcıya qoşulmuş şəbəkə adapteri olan öz növbəsində yüksək sürətli rabitə kanalları (bağlantılar) ilə birləşdirilmiş qovşaqlardan ibarətdir.

Şek. 1. Topologiya 4D-torus (3x3x3x3)

Sistem düyünlərinin bir-birinə necə tam bağlı olduğunu müəyyən edən şəbəkə quruluşu, şəbəkə topologiyası (ümumiyyətlə bir mədəcik, torus və ya qalın bir ağac) və bir sıra quruluş parametrləri ilə təyin olunur: ölçü sayı, ağac səviyyələri, torus tərəflərinin ölçüləri, ağac səviyyələrindəki açarların sayı, şəbəkə qovşaqlarının sayı marşrutlaşdırıcılardakı portlar və s. Şəkil 1 3x3x3x3 dörd ölçülü torusun topologiyasına bir nümunə göstərir.

Routerin arxitekturası şəbəkə qovşaqları arasında məlumatların ötürülməsindən məsul olan blokların quruluşunu və funksionallığını, həmçinin marşrutlaşdırma, arbitraj və məlumat axını idarəetmə alqoritmləri daxil olmaqla kanal, şəbəkə və nəqliyyat qatlarının protokollarının zəruri xüsusiyyətlərini müəyyənləşdirir. Şəbəkə adapterinin arxitekturası, prosessor, yaddaş və şəbəkə arasında qarşılıqlı əlaqə üçün cavabdeh olan blokların quruluşunu və funksionallığını müəyyənləşdirir, xüsusən MPI əməliyyatları bu səviyyədə dəstəklənir, RDMA (Remote Direct Memory Access - prosessorunun iştirakı olmadan başqa bir node yaddaşına birbaşa çıxış), paketin başqa bir nodu ilə alınmasının təsdiqlənməsi, müstəsna halların idarə olunması, paketlərin yığılması.

Bir rabitə şəbəkəsinin fəaliyyətini qiymətləndirmək üçün ən çox üç xüsusiyyət istifadə olunur: bant genişliyi (vaxt vahidinə ötürülən məlumatların miqdarı), rabitə gecikməsi (şəbəkə üzərindən məlumat ötürmə vaxtı), mesaj tempi (ümumiyyətlə, routerin daxili bölmələri arasında paket göndərmək, qəbul etmək və ötürmək zamanı çatdırılma sürətini ayrıca nəzərə alırlar).

Tamlıq üçün bu xüsusiyyətlər müxtəlif trafik növləri ilə ölçülür, məsələn, bir node bütün digərlərinə məlumat göndərdikdə və ya əksinə bütün qovşaqlar birinə məlumat göndərir və ya bütün qovşaqlar məlumatları təsadüfi istiqamətlərə göndərir. Müasir şəbəkələrdə funksionallıq tələbləri qoyulur:

  • Şmem kitabxanasının birtərəfli ünsiyyət modelini və bir çox PGAS dillərinin tətbiq olunduğu GASNet-i dəstəkləmək üçün bir seçim olaraq səmərəli şəkildə həyata keçirmək,
  • MPI-nin səmərəli həyata keçirilməsi (adətən bu halqa tamponları mexanizminin effektiv dəstəyini və alınan paketlər üçün təşəkkürləri tələb edir),
  • kollektiv əməliyyatlar üçün effektiv dəstək: yayım (eyni məlumatları eyni vaxtda bir çox qovluğa göndərmək), azaltma (ikili bir əməliyyat tətbiq etmək, məsələn, fərqli qovşaqlardan alınan dəyərlər toplusuna tətbiq etmək), sıra elementlərini düyünlər (dağılmaq) üzərində paylamaq, elementlərin bir sıra yığılması, müxtəlif qovşaqlarda yerləşir (yığılır),
  • qovşaqlararası sinxronizasiya əməliyyatları üçün effektiv dəstək (ən azı maneə sinxronizasiyası), bir node üzərində çox sayda prosesin bir şəbəkəsi ilə təsirli qarşılıqlı əlaqə və etibarlı paket çatdırılmasını təmin etmək.

Adapterin birbaşa prosessorun iştirakı olmadan ana yaddaşı ilə effektiv dəstəyi də vacibdir.

Xarici yüksək sürətli şəbəkələr

Bütün rabitə şəbəkələrini iki sinfə bölmək olar: kommersiya və xüsusi, kompüter sistemlərinin bir hissəsi olaraq hazırlanmış və yalnız onlarla birlikdə mövcuddur. Ticarət şəbəkələri arasında bazar InfiniBand və Ethernet arasında bölünür - Top500 siyahısında (İyun 2011), sistemlərin 42% -i InfiniBand, 45% -i isə Gigabit Ethernet istifadə edir. Eyni zamanda, InfiniBand, çox sayda rabitə ilə mürəkkəb hesablama tapşırıqları üçün hazırlanmış yüksək effektiv sistemlərin seqmentinə yönəldilmişdirsə, Ethernet ənənəvi olaraq qovşaqlar arasında məlumat mübadiləsinin qeyri-məqbul olduğu bir yer tutur. Superkompüterlərdə Ethernet şəbəkəsi, aşağı qiyməti və mövcudluğu səbəbindən, nəzarət trafikinə və tapşırıq trafikinə müdaxiləni azaltmaq üçün tez-tez köməkçi xidmət şəbəkəsi kimi istifadə olunur.

Inifiniband şəbəkəsi əvvəlcə Yağ ağacı topologiyası ilə konfiqurasiyaya yönəldilmiş, lakin açar və marşrutlaşdırıcıların ən son versiyaları (əsasən QLogic tərəfindən istehsal edilmişdir) çoxölçülü torus topologiyasını (Torus-2QoS Routing Engine istifadə edərək) dəstəkləyir, həmçinin 3D torusdan hibrid topologiyadır. və yağ ağacı. Sandia RedSky superkompüteri 2010-cu ilin əvvəlində yığılmış və hazırda Top500-də 16-cı yerdədir və InfiniBand şəbəkəsi və topologiyası 3D torus (6x6x8) ilə ilk genişmiqyaslı layihələrdən biridir. Ayrıca, indi RDMA əməliyyatlarının və Shmem kitabxanasının (xüsusən Qlogic Shmem) effektiv dəstəyinə çox diqqət yetirilir.

InfiniBand-ın populyarlığı nisbətən aşağı qiyməti, inkişaf etmiş proqram təminatı ekosistemi və MPI-yə effektiv dəstək olması ilə əlaqədardır. Bununla yanaşı, InfiniBand'ın çatışmazlıqları var: mesaj çatdırılmasının aşağı sürəti (Mellanox'un son həllində saniyədə 40 milyon mesaj), qısa paketlərin aşağı ötürmə səmərəliliyi, nisbətən böyük bir gecikmə (node-node-dan node-a ötürülməsi üçün 1.5 mk-dən çox və əlavə 0.1- Tranzit noduna 0,5 mk), toroidal topologiyaya zəif dəstək. Ümumiyyətlə, InfiniBand'ın kütləvi istifadəçi üçün bir məhsul olduğuna dair fikir söyləmək olar və onun inkişafı zamanı səmərəlilik və çox yönlülük arasında güzəşt edilmişdir.

Bazarda istifadəyə verilməsi üçün hazırlanan Extoll şəbəkəsini - professor Ulrich Bruening rəhbərliyi altında Heidelberg Universitetinin inkişafını da qeyd edə bilərik. Bu şəbəkənin inkişafında əsas diqqət gecikmələri minimuma endirmək və bir tərəfli rabitə ilə çatdırılma sürətini artırmaqdır. Extoll'un bir 3D torus topologiyasına sahib olacağı və hər bir zolaq üçün 10 Gb / s bant genişliyi (link daxilində serial ötürmə kanalı) və bir keçid üçün 12 zolaq genişliyi ilə optik bağlantıların istifadəsi planlaşdırılır. İndi FPGA-da Extoll şəbəkəsinin prototipləri var: R1 - Virtex4, R2 Ventoux - Virtex6-a əsaslanan iki qovşaqlı bir quruluş. Bir keçid üçün bir tərəfli bant genişliyi 600 MB / s (R1 üçün) təşkil edir. Bir prosessoru olan iki interfeys (HyperTransport 3.0 və PCI Express gen3) də dəstəklənəcəkdir ki, bu da şəbəkəni Intel və AMD platformalarına birləşdirməyə imkan verəcəkdir. Extoll bir tərəfli qeydlərin təşkilinin bir neçə yolunu, öz MMU (Yaddaş İdarəetmə Birliyi, virtual ünvanların fiziki ünvanlara tərcüməsi bloku) və atom əməliyyatlarını dəstəkləyir.

Kommersiya şəbəkələrindən fərqli olaraq xüsusi şəbəkələr daha az bazar payı tutur, lakin Cray, IBM, SGI, Fujitsu, NEC və Bull’un ən güclü superkompüterlərində istifadə olunur. Xüsusi şəbəkələri tərtib edərkən, inkişaf etdiricilər daha çox sərbəstliyə malikdirlər və son məhsulun bazar cəlbediciliyinin aşağı əhəmiyyəti səbəbindən daha mütərəqqi yanaşmalardan istifadə etməyə çalışırlar, ilk növbədə müəyyən bir tapşırıq sinifində maksimum performans əldə etmək problemini həll edirlər.

K Computer superkompüterində düyünlərində 12 qovşaqdan ibarət qruplar olan (düyünlər qrupu 3D şəbəkə ilə 12 şəbəkə ilə bağlanır və bu qrupdan olan hər bir node öz çıxışına malikdir) genişlənən 3D torus olan mülkiyyətli Tofu (TOrus FUsion) rabitə şəbəkəsindən istifadə olunur. 3D torus şəbəkəsi). Hər bir qrupun içindəki düyünlər cüt ölçülü bağlantılar olmadan 2x3x4 ölçülü tərəfləri olan bir 3D torus ilə bir-birinə bağlanır, bu da 3x4 tərəfli 2D torusa bərabərdir (beləliklə sabit iki ölçülü 5D torus alırıq). Beləliklə, Tofu şəbəkə nodunun hər biri 40 Gb / s birtərəfli ötürmə qabiliyyəti olan 10 bağlantı var. Düyünlərin maneə sinxronizasiyası və azaldılması (tam və üzən nöqtə) aparatda dəstəklənir.

Tianhe-1A superkompüterinin inkişafındakı əsas məqsədlər yüksək enerji səmərəliliyinə nail olmaq, öz prosessorları və İnfiniBand QDR-dən üstün olan şəbəkə inkişaf etdirmək idi. Süperkompüter, öz dizaynının Arch şəbəkəsi ilə qalın ağac topologiyası ilə bağlanmış 7168 hesablama qovşağından ibarətdir. Şəbəkə 16 portlu marşrutlaşdırıcılardan qurulub, bir tərəfli keçid genişliyi - 8 GB / s, gecikmə - 1,57 μs. RDMA əməliyyatları dəstəklənir və kollektiv əməliyyatlar optimallaşdırılır.

Hesablama qovşaqlarını birləşdirmək üçün toroidal topologiyasından istifadə edən sistemlərin klassik nümayəndələri ilk iki nəsildə - Blue Gene / L (2004) və Mavi Gene / P (2007) - 3D torus topologiyasından istifadə edən IBM Blue Gene seriyası üçün sistemlərdir. Mavi Gene / P-də olan şəbəkə, müasir İnfiniBand QDR bağlantısının bant genişliyindən aşağı olan bir tərəfli ötürmə genişliyi 0.425 GB / s olan nisbətən zəif əlaqələrə malikdir, lakin maneələrin sinxronizasiyası və kollektiv əməliyyatlar üçün (əsaslı ağaclara bənzər şəbəkələrdə) aparat əsaslı dəstək yaxşı miqyaslanmağa imkan verir. real tətbiqlər. Bundan əlavə, bütün interfeyslər və marşrutlaşdırma bölmələri BPC mikroprosessoruna (Blue Gene / P Chip) inteqrasiya olunur, bu da mesaj ötürmə gecikmələrini əhəmiyyətli dərəcədə azaldır. Növbəti nəsil rabitə şəbəkəsi Blue Gene / Q 5D tor topologiyasına malikdir və sələflərindən fərqli olaraq maneələrin sinxronlaşdırılması və kollektiv əməliyyatlar üçün ayrıca şəbəkələrə malik deyil. Mavi Gene / Q çipi ilk dəfə çox nüvəli - çox iplik oldu - şəbəkə tələblərini zəiflətməyə və gecikmə dözümlülüyünü təmin etməyə imkan verən 16 nüvəli bir nüvədə dörd aparat ip. Bağlantı ötürmə qabiliyyəti 2 GB / s səviyyəsinə qədər artırıldı, lakin Cray Əkizlər və ya Extoll ilə müqayisədə hələ də az qalır. Bu sistemlərdə aşağı keçid torusun böyük ölçüsü (çoxlu sayda bağlantı) və nəticədə şəbəkənin kiçik diametri (eyni sayda qovşaqları olan 3D torus topologiyası olan şəbəkələrdən əhəmiyyətli dərəcədə kiçikdir) səviyyəsindədir. Mövcud mənbələr iki Mavi Gene / Q transpetaflops superkompüterinin yaradıldığını bildirir: 20 PFLOPS və Mira - 10 PFLOPS performansı ilə Sequoia. Başa düşə bilərik ki, Mavi Gene / Q, "hamıya hamı üçün" tipli şəbəkə trafiki ilə on və yüz minlərlə hesablama qovşaqlarından istifadə ediləcək vəzifələrə yönəlmişdir.

Toroidal bir topologiyası olan rabitə şəbəkələrini qurmağa yanaşmanın digər tərəfdarı, ötürmə qabiliyyətini və qonşu qovşaqları birləşdirən əlaqələrin sayını artırarkən 3D tor topologiyasından istifadə etməyə davam edən Cray-dır. Cray toroidal şəbəkəsinin indiki nəsli Cray Əkizlər şəbəkəsidir. Bir Əkiz marşrutlaşdırıcısı əvvəlki SeaStar2 + nəslinin iki marşrutlaşdırıcısına, yəni əslində iki şəbəkə qovşağına uyğundur, buna görə Əkizlərdəki 6 keçid yerinə 10 qonşu qovşaqlara qoşulmaq üçün istifadə olunur (2-si bir-birinə iki adapter bağlamaq üçün xidmət edir).

Bir superkompüter üçün bir şəbəkənin komponentləri (şəbəkə adapterləri, açarları, marşrutlaşdırıcıları), prosessorlardan fərqli olaraq, çox vaxt daha bahalıdır və onlara giriş daha məhduddur. Məsələn, indi superkompüterlərin əsas ticarət şəbəkəsi olan İnfiniBand şəbəkəsinin açarları, hər ikisi ABŞ-ın nəzarətində olan iki şirkət tərəfindən istehsal olunur. Bu o deməkdir ki, yüksək sürətli şəbəkələr sahəsində öz inkişafları olmadıqda ABŞ, Çin və Yaponiyadan başqa hər hansı bir ölkədə müasir superkompüterlərin yaradılması asanlıqla idarə edilə bilər.

Daxili şəbəkələr

Superkompüterlərdə istifadə üçün rabitə şəbəkələrinin inkişafı bir sıra yerli təşkilatlar tərəfindən həyata keçirilir: RFNC VNIIEF (açıq mənbələrdə bu inkişaflar haqqında çox az məlumat var), Rusiya Elmlər Akademiyasının Proqram Sistemləri İnstitutu və RSK SKIF, IPM RAS və Kvant Tədqiqat İnstitutu (MVS-Express şəbəkəsi) ").

Rus-İtalyan superkompüteri olan SKIF-Aurora üçün 3D tor rabitə şəbəkəsi tamamilə Altera Stratix IV FPGA istifadə edərək qurulmuşdur, bu da hər bir keçid üçün olduqca kiçik bant genişliyini izah edir - 1,25 GB / s (FPGA resursları çox məhduddur).

MVS-Express şəbəkəsində hesablama qovşaqlarının inteqrasiyası üçün PCI Express 2.0 istifadə olunur və qovşaqlar 24 port açarları ilə bağlanır. Şəbəkə yağ ağacına yaxın bir topologiyaya malikdir. Hesablama nodeundakı şəbəkə adapterində eni 4 zolaq olan bir liman var, bunun nəticəsində bir keçid üçün bir tərəfli ən yüksək ötürmə gücü 20 Gbit / s təşkil edir. PCI Express-in MVS-Express-də istifadəsinin üstünlüyü birtərəfli rabitə imkanı ilə ortaq yaddaşın səmərəli dəstəklənməsidir. Nəticədə, şəbəkə Shmem kitabxanası və PGAS dillərini (UPC, CAF) tətbiq etmək üçün əlverişlidir.

Rusiya Federasiyası Sənaye və Ticarət Nazirliyinin dəstəyi ilə NICEVT ASC, superkompüterlərin inkişafı üçün yerli texnologiyaların yaradılması üçün əsas ola biləcək 4D-tor topologiyası ilə Angara rabitə şəbəkəsinin inkişafı üzərində işləyir.

Şəbəkə "Angara"

Angara şəbəkəsinin inkişafının əsas vəzifələri:

  • birtərəfli rabitə (put / get) və PGAS dillərinə (paralel proqramlaşdırmanın əsas vasitəsi kimi) effektiv dəstək;
  • Effektiv MPI dəstəyi
  • öz kristalının buraxılması (yüksək məlumat ötürmə sürətinə və aşağı gecikmələrə nail olmaq üçün),
  • adaptiv uğursuz təhlükəsiz paket ötürülməsi,
  • müasir prosessorlar və çipsetlər ilə effektiv iş.

Bu şəbəkənin inkişafının ilk mərhələsində (2006) müxtəlif şəbəkə seçimlərinin simulyasiyası aparıldı və topologiya, marşrutlaşdırma arxitekturası, marşrutlaşdırma alqoritmləri və arbitraj ilə bağlı əsas qərarlar qəbul edildi. Toroidal topologiyaya əlavə olaraq, Cayley şəbəkələri və "qalın ağac" nəzərdən keçirildi. Dörd ölçülü torus, daha kiçik marşrutlarla müqayisədə daha sadə marşrutlaşdırma, yaxşı ölçülmə qabiliyyəti və yüksək bağlantısı ilə seçildi. Şəbəkə modelləşdirməsi, şəbəkə memarlığının müxtəlif parametrlərinin əsas performans xüsusiyyətlərinə təsirini ətraflı öyrənməyə, yaddaşa intensiv nizamsız çıxışı olan tapşırıqların hərəkət qaydalarını başa düşməyə imkan verdi. Nəticədə optimal tampon ölçüləri, virtual kanalların sayı seçildi və potensial problemlər təhlil edildi.

2008-ci ildə FPGA yönlendiricinin ilk prototipi ortaya çıxdı - 2x3 torusa qoşulmuş Virtex4-də altı qovşaqdan ibarət bir şəbəkə düzülüşü, bunda yönləndiricinin əsas funksionallığı müzakirə edildi, səhvlərə dözümlü məlumat ötürülməsi işləndi, sürücü və aşağı səviyyəli kitabxana yazıldı və düzəldildi, Shmem kitabxanaları daşındı və yerləşdirildi MPI İndi ikiqat ölçülü torus 3x3-ə bağlanmış doqquz qovşaqdan ibarət üçüncü nəsil plan tərtibatına başlandı. Собран стенд с двумя узлами для тестирования новых разъемов и каналов передачи данных, предполагаемых к использованию с будущими кристаллами маршрутизатора ВКС. При разработке принципов работы сети ряд деталей был позаимствован из работ и , а также в том или ином виде из архитектур IBM Blue Gene и Cray SeaStar.

Сеть «Ангара» имеет топологию 4D-тор. Поддерживается детерминированная маршрутизация, сохраняющая порядок передачи пакетов и предотвращающая появление дедлоков (взаимных блокировок), а также адаптивная маршрутизация, позволяющая одновременно использовать множество путей между узлами и обходить перегруженные и вышедшие из строя участки сети. Çoxölçülü bir torusun üstünə qoyulmuş bir ağacın topologiyasına sahib bir virtual alt şəbəkədən istifadə edərək həyata keçirilən kollektiv əməliyyatların (yayım və azaldılması) dəstəklənməsinə xüsusi diqqət yetirilmişdir. Təchizat səviyyəsindəki şəbəkə, iki növ uzaqdan yazma, oxumaq və atom əməliyyatları (əlavə və eksklüziv OR) dəstəkləyir. Uzaqdan oxumağın icra sxemi (sorğu göndərmək və cavab almaq) Şekildə göstərilmişdir. 2 (uzaqdan qeyd və atom əməliyyatları oxşar şəkildə aparılır). Ayrı bir blokda, bir ana ilə bir interfeysdən ötürüldükdə əməliyyat başına yararlı məlumatların payını artırmaq üçün şəbəkədən alınan mesajları birləşdirmək üçün məntiq tətbiq olunur (bir ana prosessor-yaddaş-körpü körpüsüdür).

Şek. 2. Angara şəbəkəsində uzaqdan oxumağın sxemi

Məlumat bağlantısı qatında, uğursuz təhlükəsiz paket ötürülməsi dəstəklənir. Marşrutlaşdırma masalarını yenidən quraraq uğursuz rabitə kanallarını və qovşaqlarını keçmək üçün bir mexanizm də mövcuddur. Müxtəlif xidmət əməliyyatlarını yerinə yetirmək üçün (xüsusən, marşrutlaşdırma masalarını qurmaq / yenidən qurmaq) və bəzi hesablamalar aparmaq üçün bir xidmət prosessoru istifadə olunur. Əsas interfeys PCI Express istifadə edir.

Şek. 3. "Angara" şəbəkə adapteri / yönləndiricisi ilə hesablama qovşağının quruluşu

Routerin əsas blokları:

  • host sistemi ilə interfeys, ana interfeysdə paketlərin qəbulu və göndərilməsi üçün cavabdehdir;
  • şəbəkəyə göndəriləcək paketləri meydana gətirən və şəbəkədən gələn paketlərin başlıqlarını tərtib edən bir enjeksiyon və boşalma vahidi;
  • ana sistemin yaddaşından məlumat tələb edən paketləri emal edən bir sorğu işləmə bölməsi (məsələn, oxuyur və ya atom əməliyyatları),
  • kollektiv əməliyyatlarla əlaqəli paketləri emal edən kollektiv əməliyyatlar şəbəkəsi, xüsusən azaltma əməliyyatları həyata keçirir, yayım tələb paketlərini yaradır;
  • xidmət sükan prosessoruna gedən və çıxan paketləri emal edən bir xidmət əməliyyatı vahidi,
  • müxtəlif virtual kanallardan girişləri və enjektorların girişlərini müxtəlif istiqamətlərə və ejektorlara birləşdirən bir keçid,
  • müəyyən bir istiqamətdə məlumatların ötürülməsi və alınması üçün rabitə kanalları,
  • Paketləri müəyyən bir istiqamətə göndərmək üçün məlumat ötürmə qurğusu və paketləri qəbul edən və gələcək talelərini təyin edən bir qəbuledici və yönləndirici bölmə.

Host-un yönləndirici ilə qarşılıqlı əlaqəsi (mərkəzi prosessorda yerinə yetirilən kod), marşrutlaşdırıcının qaynaq bölgələrinin ünvanlarına (yaddaşla əks olunmuş giriş / çıxış) yazılmış yaddaş ünvanlarına yazmaqla həyata keçirilir. Bu, tətbiqetmənin, nüvənin iştirakı olmadan marşrutlaşdırıcı ilə əlaqə yaratmasına imkan verir ki, bu da paketlərin göndərilməsinin yerüstü xərclərini azaldır, çünki nüvənin kontekstinə keçid və geri dönmə yüzdən çox saat dövründən gedir. Paketləri göndərmək üçün yaddaş bölgələrindən biri istifadə olunur, bu halqa tamponu hesab olunur. Yaddaş yaddaşını kopyalamadan əməliyyatların aparılması üçün ayrıca bir bölgə var (məlumat yaddaşdan oxunur və DMA əməliyyatları vasitəsilə rabitə şəbəkəsinin adapteri tərəfindən yazılır) və nəzarət qeydləri olan bir bölgə var. Routerin müəyyən mənbələrinə giriş nüvə modulu tərəfindən idarə olunur.

Daha yüksək səmərəliliyi əldə etmək üçün bir qovşaqda yalnız bir hesablama tapşırığının yerinə yetirilməsi qərara alındı, bu virtual yaddaşın istifadəsi ilə əlaqəli yerüstü xərcləri aradan qaldırdı, tapşırıq müdaxiləsinin qarşısını aldı, tam MMU olmaması səbəbindən yönləndiricinin arxitekturasını sadələşdirdi və hər şeydən qaçındı onun rabitə gecikmələri işi, eyni zamanda bir düyündəki müxtəlif tapşırıqlar proseslərinin təhlükəsizliyini aradan qaldıraraq şəbəkə təhlükəsizlik modelini asanlaşdırır. Bu həll, əsasən böyük ölçülü tapşırıqlar üçün nəzərdə tutulduğu kimi (müxtəlif ölçülü tapşırıqlar üçün universal bir şəbəkə olan InfiniBand-dan fərqli olaraq) şəbəkənin işləməsinə təsir göstərmədi. Bənzər bir qərar bölmə üçün vəzifənin unikallığına məhdudiyyət tətbiq olunduğu IBM Blue Gene-də qəbul edildi.

Təchizat səviyyəsində, bir tapşırıqdakı çox mövzu / prosesin yönləndiricisi ilə eyni vaxtda dəstəklənir - bu, qeyd paketləri üçün bir neçə halqa tamponu vasitəsilə proseslər üçün istifadə edilə bilən bir neçə injection kanal şəklində həyata keçirilir. Bu tamponların sayı və ölçüsü dinamik olaraq dəyişə bilər.

Angara şəbəkəsi üçün əsas proqramlaşdırma rejimi MPI, OpenMP və Shmem, həmçinin GASNet və UPC'nin birgə istifadəsidir.

Şəbəkənin yoxlanılması və prototiplənməsi başa çatdıqdan sonra VLSI çipinin buraxılması planlaşdırılır. Prototip VLSI dəsti əsas texnoloji həllərin ayırılması, texnoloji bir proses və simulyasiya nəticələrinin eksperimental yoxlanılması üçün hazırlanacaqdır. Prototip bütün əsas funksionallığı ehtiva edir, PCI Express gen2 x16 interfeysi ilə işləyir və 75 Gb / s ötürmə gücü ilə əlaqələndirir.

Angara şəbəkəsinin bazara iki variantda təqdim edilməsi planlaşdırılır: standart prosessorları və çipsetləri olan klaster sistemləri üçün PCI Express kartları şəklində ayrı bir ticarət şəbəkəsi və NICEVT-də hazırlanan AMD prosessorları əsasında dörd soketli bıçaq sisteminin bir hissəsi kimi.

Pin
Send
Share
Send
Send