Selasa, 14 September 2010

Optimasi Aplikasi Mobile dengan Deep Packet Inspection






Data Handphone menyediakan peluang pertumbuhan penting bagi operator seluler, tetapi adopsi akan lambat kecuali jaringan dapat memberikan layanan yang baik kepada semua pelanggan. inspeksi paket Deep memungkinkan para operator untuk memahami aplikasi pelanggan mereka gunakan dan untuk membangun jaringan yang tepat.

Industri komunikasi mobile broadband mengakui luas sebagai mesin pertumbuhan untuk operator nirkabel. Sebagai penetrasi telepon seluler mencapai kejenuhan dan dataran tinggi suara pendapatan, pendapatan mobile data adalah salah satu segmen yang terus berkembang. Mobile data tersedia melalui 3G (generasi ketiga) jaringan, yang semakin menunjukkan tekanan dari peningkatan lalu lintas. Kebanyakan operator telah mengumumkan rencana untuk pindah ke LTE (jangka panjang-evolusi) jaringan, yang menjanjikan lebih besar daripada tingkat-data-100-Mbps, suatu peningkatan lima kali lipat dari 3G HSPA + (high-speed-paket-akses) jaringan. J cepat melihat pola lalu lintas pelanggan menjelaskan bahwa upgrade jaringan 3G bahkan dari LTE menang, t memberikan tarif data yang memadai untuk menjamin layanan yang baik bagi semua pengguna. Namun, teknologi tambahan seperti DPI (inspeksi paket yang mendalam) dapat memastikan bahwa prioritas dan dikelola lalu lintas mengoptimalkan pengalaman pengguna.

Tahun lalu akhirnya melihat ledakan pertumbuhan lalu lintas wireless-data dan analis industri pendapatan yang ada untuk perkiraan tahun. Wireless-layanan data sekarang adalah pasar $ 130.000.000.000 global, dengan $ 40 milyar Amerika Utara. Perusahaan penelitian IDC, Äôs proyeksi pertumbuhan pendapatan wireless-data hingga 2012 yang sangat menyambut baik untuk operator nirkabel, mengingat dataran tinggi pendapatan suara pada tahun 2008 (Gambar 1).

DPI Pasal Diagram mengoptimalkan 1

Gambar 1: IDC, Äôs operator mobile-analisis menunjukkan peningkatan yang tidak proporsional dalam penggunaan wireless-data dan pendapatan dibandingkan dengan layanan suara biasa.

operator jaringan dapat menggunakan salah satu dari beberapa teknik untuk menambah kapasitas dan memenuhi permintaan untuk mobile broadband. Pertama, mereka dapat meningkatkan efisiensi spektrum. LTE menjanjikan peningkatan empat kali lipat, bit per detik Äîin per hertz, Äîover WCDMA nya (wideband-code-divisi-akses-jamak) pendahulunya. Namun, data harga yang tumbuh terlalu cepat untuk perbaikan dalam efisiensi spektral untuk membuat lebih dari satu lekuk di masalah. Ini akan memakan waktu bertahun-tahun dari rilis asli rollouts LTE untuk jaringan penuh dan adopsi terjadi. Cisco mengharapkan lalu lintas data mobile untuk meningkatkan 66 kali lipat antara 2008 dan 2013 (Referensi 1).

teknik lain adalah dengan menggunakan spektrum yang lebih; saluran yang lebih luas berarti lebih banyak bandwidth. Namun, spektrum adalah sumber daya mahal, dan operator yang paling sedikit memiliki spektrum yang tersedia untuk cadangan. Atau, operator dapat menggunakan teknik-sel membelah; menambahkan situs sel kecil mengurangi kepadatan pelanggan dalam sebuah situs sel tertentu. Dengan menyusut sel, jumlah pelanggan per sel berkurang, dan bandwidth rata-rata per pelanggan meningkat sesuai. Pendekatan ini baik yang paling mudah dan pilihan yang paling mahal karena akses radio adalah bagian priciest jaringan operator, dengan biaya yang secara langsung proporsional terhadap jumlah situs sel.

Alternatif lain adalah dengan lebih efisien mengalokasikan bandwidth pengguna dengan menggunakan teknologi baru dpi. DPI mengelola jaringan data dan mengoptimalkan lalu lintas data. Mencapai luar IP (Internet Protocol) header dan memeriksa isi paket. Meskipun Anda dapat menggunakan teknik ini untuk mencari kata kunci atau konten lainnya yang kebanyakan konsumen merasa melanggar norma-norma privasi, penggunaan paling umum DPI hanya untuk menentukan paket aplikasi: Apakah e-mail, Web, video, atau P2P (peer-to-peer) paket? Kekurangan dari pendekatan-pendekatan lain meningkatkan daya tarik lebih efisien menggunakan bandwidth secara keseluruhan dan memastikan bahwa aplikasi dan pelanggan cukup bandwidth saham. DPI memungkinkan implementasi dan penegakan kebijakan tersebut.
Ancaman nyata

Media cakupan mobile broadband cenderung untuk menyarankan bahwa smartphone, seperti iPhone dan BlackBerry, yang mendorong sebagian besar kemacetan pada jaringan. Namun, sebagian besar pertumbuhan data sebenarnya berasal dari komputer laptop dengan kartu data dan USB (Universal Serial Bus) dongle. Operator yang ingin mendorong pertumbuhan mobile-data telah mempromosikan ide mobile broadband, dan beberapa bahkan subsidi jaringan dengan built-in modem selular. Meskipun smartphone menghasilkan sebanyak 30 data lalu lintas telepon biasa, laptop dengan kartu data menghasilkan 15 kali lebih banyak lalu lintas dari smartphone, atau sebagai lalu lintas sebanyak 450 telepon biasa (Referensi 2). Laptop lebih kondusif untuk browsing internet dan lebih besar, lebih tinggi resolusi layar bahwa permintaan konten berkualitas tinggi. Laptop pengguna juga lebih mungkin untuk menjalankan aplikasi P2P yang dapat mengkonsumsi petak bandwidth besar.
Berbagi data saluran

Para pengembang jaringan 3G dan LTE dipekerjakan konsep umum saluran data tunggal bahwa semua pelanggan yang ada pada sel tertentu. Mereka memilih arsitektur ini karena mereka menganggap bahwa pengguna akan menggunakan mobile data terutama untuk, Äúbursty, AU kegiatan, seperti surfing Web dan e-mail. Dalam kegiatan ini, sebuah saluran data bersama berarti bahwa pengguna mendapatkan bandwidth tinggi untuk download tetapi juga bahwa pengguna dapat menggunakan saluran tersebut sedangkan pengguna lain membaca e-mail atau gulir melalui halaman Web. Saluran data bersama berkinerja buruk ketika bertemu transfer berkelanjutan yang besar. Pengalihan ini mengisi saluran bersama dan menyebabkan paket menjatuhkan dan latency panjang untuk setiap pelanggan di sel. Dengan pertumbuhan mobile data dan penggunaan yang luas dari kartu wireless-data, video dan kegiatan P2P, yang cocok dengan profil transfer berkelanjutan yang besar, menjadi lebih umum. Video dan lalu lintas P2P saat ini mencakup 60% dari semua data dan harus tumbuh menjadi 74% pada tahun 2013, menurut Cisco (Gambar 2).

DPI Pasal Diagram mengoptimalkan 2

Gambar 2: Cisco, ramalan Äôs menunjukkan bahwa layanan video akan melihat pertumbuhan penggunaan di masa mendatang.
Baca lebih lanjut In-Depth Teknis Fitur

Pada hari-hari awal Internet, IP header aplikasi dengan jelas ditandai, tetapi kombinasi penomoran keterbatasan dan firewall perusahaan telah mendorong pengembang aplikasi untuk masker jenis lalu lintas. Sebagian besar lalu lintas hari ini tampak seperti lalu lintas Web jika Anda hanya memeriksa header. Setelah operator menentukan aplikasi dan pelanggan, mereka dapat menerapkan berbagai kebijakan untuk mengurangi pendapat jaringan, melaksanakan rencana-layanan data baru, atau blok yang melanggar lalu lintas operator, syarat Äôs pelayanan. DPI memungkinkan operator untuk menawarkan data rencana berjenjang-layanan yang mereka berdasarkan berbagai kriteria. Kebanyakan operator selular saat ini menawarkan satu rencana penggunaan data dan topi data pada sekitar 5 GBytes / bulan. Salah satu pendekatan alternatif sederhana adalah untuk menawarkan data rencana dengan tutup berukuran 5, 10, 25, dan 100 GBytes / bulan, misalnya. Operator juga dapat menawarkan rencana yang tutup kecepatan mobile broadband di tingkat seperti 128 kbps, 256 kbps, dan 1 Mbps.

Dengan menggunakan DPI, operator bisa membangun rencana yang menunjukkan pemahaman tentang bagaimana pelanggan menggunakan jasa mereka. Anda mungkin dapat mengoptimalkan sampel beberapa rencana untuk Surfing di Web dan e-mail sesi sekitar 64 kbps tapi dengan topi bandwidth yang ketat pada setiap trafik P2P. Orang lain mungkin menawarkan layanan yang memungkinkan video streaming YouTube-gaya di sekitar 250 kbps tetapi dengan batas-batas high-definition video streaming dari 4 Mbps atau lebih tinggi. layanan lain mungkin menarik gamer, menawarkan paket latensi rendah untuk game. Perusahaan dapat memilih paket premium, yang menawarkan prioritas lalu lintas di situs sel untuk e-mail, CRM (hubungan pelanggan-manajemen), dan aplikasi perusahaan lainnya. Sebuah layanan untuk pengguna P2P akan menawarkan bandwidth tak terbatas pada jam off-peak tapi tutup erat bandwidth P2P selama masa puncak pemakaian.
Tantangan Teknis

DPI teknologi sederhana dalam konsep tetapi kompleks dalam praktek. Di tingkat konseptual, melihat sebuah paket untuk menentukan aplikasi dan pelanggan dan kemudian mengambil tindakan pada identifikasi suara mudah. Kompleksitas dalam DPI muncul dari tarif line jaringan dan aplikasi yang berkembang pesat. Harga paket ini di jaringan carrier mengejutkan. Saluran 10-GbE (gigabit-Ethernet) tunggal dapat mendukung 30.000.000 paket / detik dengan paket berukuran minimal. Bahkan dengan profil lalu lintas yang lebih realistis dan ukuran paket dari 200 byte, yang menyalurkan 10-GbE memiliki 10 juta paket / detik.

Pada kecepatan itu, sistem memiliki hanya 100 nsec untuk menerima dan memeriksa paket, menentukan aplikasi-nya, memodifikasi jika perlu, dan mengirimkannya. Dengan asumsi modern, 3-GHz, prosesor single core, kerangka waktu ini setara dengan hanya 300 instruksi, senilai AO eksekusi, yang biasanya tidak cukup untuk bahkan menerima paket. Kenyataan ini telah mendorong penerapan multicore, prosesor multithreaded untuk pemeriksaan paket. Dengan 32 core, atau benang, menyerang masalah, bahkan dengan kecepatan yang lebih sederhana inti-jam 1-GHz, bahwa sistem yang sama sekarang harus proses hanya 300.000 paket per core / detik dan siklus 3.200 jam lebih masuk akal / paket, cukup untuk pemeriksaan , klasifikasi, dan modifikasi.

Bahkan dengan kinerja ini, pembawa menuntut sistem yang dapat hari ini proses 40 Gbps lalu lintas, meningkat menjadi 2011 100 atau 200 Gbps oleh. Tren ini telah mendorong industri ini ke arah pendekatan berbilah karena alat tunggal bisa menangani beberapa gigabit per detik atau bahkan 10 Gbps, tapi tidak 20, 40, atau 100 Gbps. Sebuah sistem berbasis blade DPI dapat skala sampai 80 Gbps penanganan lalu lintas, dengan masing-masing pisau DPI 10 Gbps penanganan lalu lintas (Gambar 3).

Keluarga Produk FlexTCA Foto

Gambar 3: Sebuah alat berbasis blade yang setuju dengan kemampuan scalable DPI (courtesy Continuous Computing).

Tantangan kedua dalam DPI adalah terpercaya mengidentifikasi aplikasi hanya berdasarkan arus lalu lintas. Fitur ini sangat penting karena sistem DPI mungkin menggunakan jenis aplikasi untuk mengatur prioritas paket-paket, yang memutuskan untuk drop paket jika kemacetan muncul, tagihan pelanggan berdasarkan aplikasi yang berbeda, dan bahkan memblokir aplikasi tertentu. Mengingat dampak potensial dari kesalahan identifikasi, sangat penting untuk secara akurat mengklasifikasikan sebanyak mungkin aplikasi dan untuk meminimalkan jumlah aplikasi palsu pertandingan. Namun persyaratan ini harus berlangsung dalam suatu lingkungan di mana pengembang membuat aplikasi setiap hari dan di mana berbagai aplikasi populer di berbagai belahan dunia.

Untuk membuat keadaan menjadi lebih buruk, aplikasi tertentu, terutama beberapa varian P2P, aktif mencoba untuk menyamarkan identitas mereka untuk menggagalkan firewall perusahaan dan lalu lintas-membentuk sistem. Memecahkan masalah ini membutuhkan aplikasi database tanda tangan serta tim yang aktif dapat memperbarui signature ini pada deteksi aplikasi baru. Vendor DPI-sistem bisa mengatasi persyaratan; alternatif, pihak ketiga yang mengkhususkan diri dalam identitas lalu lintas sering kali bersedia lisensi aplikasi tanda tangan.
Adaptif traffic shaping

Salah satu contoh aplikasi DPI maju membentuk lalu lintas adaptif. Dalam setiap jaringan selular, peer-situs lain beban sel setiap saat. Sel-lokasi muat tergantung pada lokasi, jumlah pengguna, dan jenis aplikasi, dan bervariasi dari waktu ke waktu. Sebagai contoh ekstrem, sebuah situs sel melayani sebuah stadion olahraga besar akan melihat lonjakan lalu lintas selama permainan tapi tenang sepanjang waktu. Demikian pula, sebuah situs sel mencakup sebuah taman bisnis yang paling aktif di siang hari, sedangkan situs sel mencakup pinggiran kota akan lebih sibuk pada malam hari.

Traffic shaping dalam jaringan nirkabel secara inheren lebih kompleks daripada di jaringan kawat-line karena beban variabel dinamis dan kapasitas dari waktu ke waktu. Adaptive meningkatkan lalu lintas membentuk kawat-line pembentuk lalu lintas dengan menyediakan visibilitas ke dimensi tambahan ini, sehingga memungkinkan operator untuk memberlakukan kebijakan yang mempekerjakan pengetahuan pembebanan sel-situs. Operator mungkin memblokir lalu lintas P2P dan menurunkan lalu lintas video selama jam-jam puncak stadion, misalnya, untuk memastikan bahwa kapasitas yang cukup tetap bagi pengguna untuk men-download e-mail atau menelusuri Web. Sebaliknya, layanan bit-berat dapat berjalan dengan kecepatan penuh ketika jaringan tidak sibuk.

Selasa, 07 September 2010

VDPI dan implementasinya dalam Jaringan Nirkabel





DPI menawarkan kemampuan untuk operator untuk memeriksa setiap paket, mengklasifikasikan itu sebagai bagian dari aliran, dan kemudian memeriksa aliran untuk menentukan aplikasi, pelanggan serta penyedia konten.

Dalam nirkabel seperti pada jaringan wireline, tidak pernah ada cukup bandwidth. Pengenalan ponsel pintar seperti iPhone, serta mobile data kartu, telah menciptakan kongesti signifikan pada jaringan 3G dengan pengguna mengeluh download lambat dan menjatuhkan panggilan. Generasi berikutnya dari jaringan selular, kadang-kadang disebut 4G tetapi lebih tepat disebut 3G LTE (Long Term Evolution), menjanjikan untuk menawarkan peningkatan dramatis dalam bandwidth untuk pelanggan - sampai 200 Mb / s downlink. Dengan bandwidth banyak, itu tergoda untuk berpikir dari LTE sebagai mewakili peluru perak untuk masalah bandwidth, tapi melihat lebih dekat pada pola lalu lintas menunjukkan sebaliknya. Deep Packet Inspection, umumnya dikenal sebagai DPI, telah menerima nama buruk karena beberapa implementasi awal, tetapi generasi terbaru dari produk DPI janji untuk memungkinkan penyedia layanan untuk mengoperasikan jaringan mereka lebih efisien sementara memfasilitasi aliran pendapatan baru. Berikut ini adalah primer.

3G/LTE KAPABILITAS

3G dan jaringan LTE dibangun di sekitar saluran data bersama untuk semua perangkat mobile di sel. Seperti ditunjukkan dalam Gambar 1, semua data perangkat feed data melalui saluran tunggal. Arsitektur ini dipilih ketika dianggap bahwa penggunaan utama data mobile akan web surfing dan email. Aplikasi ini inheren bursty, dan memiliki saluran data bersama antara banyak pengguna berarti bahwa setiap pengguna tertentu mendapat bandwidth tinggi saat men-download suatu halaman web, tetapi tidak membuang-buang saluran ketika idle.

Masalahnya, bagaimanapun, adalah bahwa saluran data bersama melakukan yang sangat buruk ketika satu atau lebih pelanggan mencoba menggunakan jaringan untuk transfer berkelanjutan yang besar. download tersebut menyerap sejumlah besar bandwidth saluran bersama dan dapat menyebabkan kemacetan untuk setiap user lain dalam sel. Dua jenis transfer di profil ini cocok khususnya bandwidth tinggi berkelanjutan download: video dan peer-to-peer (P2P). Seperti ditunjukkan dalam Gambar 2, video dan P2P telah account sebesar 60% dari data lalu lintas dan diperkirakan akan tumbuh menjadi 74% pada tahun 2013.

VDPI dan implementasinya pada Multi Processor


Sebuah kelas baru prosesor telah mulai muncul dalam berbagai penyimpanan, keamanan, stasiun basis nirkabel, dan jaringan untuk menggantikan aplikasi yang sangat mahal - dengan waktu yang lama untuk boot - Aplikasi proprietary Sirkuit Terpadu Tertentu (ASICs) yang dikembangkan oleh sistem OEM solusi penyedia maupun yang dirancang oleh raksasa industri, seperti LSI Logic dan IBM.

Ini kelas baru prosesor multi-core adalah terdiri dari delapan, enam belas, bahkan enam puluh empat core prosesor individu dengan kontroler memori terintegrasi, aku berbagai / O interface, dan mesin akselerasi terpisah.

Meskipun ini kelas baru prosesor telah membuat langkah besar dalam mengatasi keterbatasan dari prosesor generasi sebelumnya, tidak semua kelas "baru" prosesor multi-core diciptakan sama. Beberapa perusahaan yang mengembangkan prosesor ini threading menambahkan kemampuan untuk mengatasi latency memori, dan juga termasuk antarmuka asli 10Gbps, sementara yang lain termasuk mesin keamanan dan bahkan mesin ekspresi reguler yang mendukung aplikasi yang sangat khusus.

Alih-alih memeriksa semua fitur di sejumlah prosesor multi-core dan membandingkannya dengan sedikit bit, makalah ini akan memfokuskan pada satu elemen arsitektur kritis, subsistem memori. Subsistem memori sangat penting karena ini adalah faktor utama dalam menentukan skalabilitas dan batas atas kinerja prosesor yang dapat dicapai.

Memori arsitektur dibandingkan di sini adalah berdasarkan dua prosesor multi-core terkemuka di pasaran saat ini:

1. Single channel, baris cache lebar (Single / Wide)
2. Dual channel, garis cache sempit (Dual / sempit)

Pertanyaan yang akan dibahas adalah: arsitektur yang lebih unggul dalam memberikan kinerja yang diperlukan untuk bersaing dengan suara yang berkembang, video, dan data lalu lintas bahwa pasar membutuhkan hari ini?

Single Channel, Cache Line Wide (Single / Wide)
Saluran tunggal, cache mendekati garis lebar menggunakan single channel memory interface antara prosesor dan memori DDR2. Lebar saluran adalah 128-bit dan menggunakan 16-bit ECC dengan total 144-bit. Dalam hal ini "Single / Wide" pendekatan, baris cache 128-byte yang digunakan dan setiap akses ke memori adalah-ledakan-8 membaca atau menulis.

Hasil dari pendekatan ini adalah bahwa setiap meledak ke memori mengisi atau mengosongkan cache garis tunggal. Dengan dukungan untuk DDR2-800 memori, / Single Wide pendekatan memiliki bandwidth dari memori 12.8GBps, dan dicapai dengan mendukung potensi sebesar 100 juta transaksi per detik, dimana transaksi adalah baik membaca atau menulis dari 128-byte cache line.

Dual Channel, Cache Line Persempit (Dual / sempit)
Saluran dual, arsitektur cache garis tipis menggunakan pendekatan yang berbeda untuk memaksimalkan kinerja memori. The "Dual / Persempit" memanfaatkan arsitektur memori saluran dua sebagai antarmuka antara prosesor dan memori DDR2 di mana masing-masing saluran adalah 64-bit yang luas dengan 8-bit ECC.

baris cache dalam arsitektur ini adalah 32-byte dan setiap akses ke memori adalah-ledakan-4 membaca atau menulis. Arsitektur ini juga mengisi atau mengosongkan jalur seluruh cache dengan satu transaksi. Arsitektur / Dual Persempit mencapai 12.8GBps sama bandwidth memory baku, tetapi mencapai angka ini melalui 400,000,000 mungkin transaksi per detik.

Dari perspektif teoretis, di kecepatan DDR2-667, di / Single Wide kinerja memori interface 83.000.000 operasi baris cache per detik, sedangkan pendekatan / Dual Persempit adalah 334.000.000 operasi baris cache per detik. Namun, memori DDR2 adalah jauh dari ideal dan memiliki beberapa faktor yang dapat mengurangi kinerja teoretis, termasuk:

1) kali Refresh
2) Siklus Bisnis kali
3) Bank keterbatasan waktu akses

Simulasi dikembangkan untuk membandingkan dua pendekatan arsitektur. Untuk konfigurasi khas 4GB DDR2-667 memori dan klasifikasi beban kerja paket seperti dijelaskan di bawah ini, / Single menghasilkan arsitektur Wide 64.000.000 operasi baris cache per detik, sedangkan / Dual Persempit hasil arsitektur 204.000.000 operasi baris cache per detik.

Penting untuk dicatat bahwa meskipun arsitektur / Single Wide memiliki efisiensi 77%, [64MOps aktual / 83MOps] potensial, dibandingkan dengan 61% efisiensi [] 204MOps aktual / 334MOps potensial, / Dual Persempit arsitektur menyediakan lebih dari tiga kali jumlah transaksi per detik. Sebagaimana dijelaskan di bawah, ini memainkan peran yang signifikan dalam paket throughput dalam aplikasi nyata.

Sebuah Aplikasi Umum "Load Balancing / Paket Distribusi
AdvancedTCA (ATCA) pisau paket prosesor sering diminta untuk bertindak sebagai akhir depan untuk seluruh casis pisau. Dalam aplikasi ini, prosesor paket menghubungkan ke jaringan di satu sisi dan satu set pisau aplikasi di sisi lain.

Lebih jauh lagi, tindakan-tindakan paket pisau sebagai penyeimbang beban prosesor dan memungkinkan seluruh koleksi blades aplikasi untuk muncul sebagai alamat IP tunggal "kritis untuk menyembunyikan kompleksitas sistem internal dari jaringan.

Untuk memperoleh pemahaman untuk tantangan solusi harus melakukan untuk melakukan 10Gbps dari load balancing dan terjemahan alamat jaringan (NAT), pertimbangkan sistem tertentu agar berjalan pada 10Gbps dengan paket minimum berukuran 64-byte "yang 16.400.000 paket per detik, dalam arah masing-masing, atau 32.900.000 paket per detik melalui paket prosesor.

Sebuah penyeimbang beban dioptimalkan / mesin NAT akan menjalankan langkah-langkah berikut ini untuk setiap paket:

1. Menerima paket dan tempat ke dalam memori cache
2. Lakukan pencarian aliran
3. Memodifikasi header paket per aliran
4. Kenaikan statistik tentang paket / aliran
5. Kirim paket dari cache untuk proses selanjutnya

Catatan bahwa ini merupakan kasus terbaik - paket yang tidak pernah disimpan untuk DRAM - hanya ke memori cache, sehingga jumlah akses memori disimpan ke minimum.

Arus Lookup Algoritma
Seperti paket yang diterima ke dalam sistem, mereka harus dikategorikan sebagai apakah atau tidak cocok dengan aliran yang sudah ada atau bagian dari sebuah aliran baru. Hal ini biasanya dilakukan dengan pertandingan 5-tupel, di mana lima bidang yang mendefinisikan aliran dicocokkan dengan database arus yang ada:

1) Alamat IP Sumber
2) Sumber Port
3) Tujuan Alamat IP
4) Port Tujuan
5) Protokol

Fungsi pencarian yang paling umum untuk memeriksa database arus yang ada adalah lookup hash. lookup Hash adalah di mana kunci dibuat berdasarkan 5-tupel dan kemudian diindeks ke daftar kunci yang cocok.

Kunci menunjukkan catatan yang mendefinisikan setiap aliran dan catatan dapat dirantai bersama-sama dalam beberapa kasus 5-tupel hash dengan nilai yang sama. Setiap pencarian membutuhkan minimal dua lookup memori, satu untuk mencari daftar kunci dan yang kedua untuk mengambil catatan aliran. Jika beberapa arus hash ke tombol yang sama, mengakses memori tambahan akan diperlukan untuk mengikuti daftar catatan dirantai.

Dalam rangka meminimalkan jumlah tabrakan, jumlah ember hash biasanya dipilih untuk minimal 2x lebih besar daripada jumlah arus yang diharapkan, dan bahkan dengan ember 2x, 2,24 mengakses memori akan dibutuhkan rata-rata. Dengan lebih dari 10x ember arus, ini turun menjadi 2,05 mengakses memori per paket.

Statistik. Setelah aliran tersebut telah ditemukan, statistik tentang aliran harus diperbarui. Dalam mesin berperforma tertinggi NAT, statistik ini disimpan dalam baris cache yang sama dengan catatan aliran, yang berarti bahwa statistik sudah di memori setelah aliran telah ditemukan. Setelah statistik bertambah, baris cache harus ditulis kembali ke memori utama, memerlukan satu akses memori lebih lanjut.

Kinerja cache. lookup aliran ini dan statistik memperbarui operasi membuat memori cache berkinerja buruk karena jumlah paket arus cenderung jauh lebih besar dari jumlah baris cache, yang berarti bahwa aliran yang diberikan tidak mungkin dalam cache utama pada waktu tertentu.

Contoh: Asumsikan arus 500K, dengan 4M ember hash. Jika setiap ember hash adalah sebuah pointer 8-byte, dan setiap record aliran adalah 32-byte, maka tabel hash adalah 32MB (4M * 8-byte), dan meja aliran 16MB (500K * 32 byte). Dengan cache 2MB, kesempatan bahwa aliran diberikan sudah akan berada dalam cache hanya 4% (2 / 48). Dengan mengakses memori diperlukan 3,05 per paket, cache hanya memiliki dampak kecil dan menjatuhkan mengakses memori rata-rata per paket untuk 2,93.

Diperlukan Memori Kinerja
Sebuah mesin load-balancing yang sangat optimal / mesin NAT dapat dibuat membutuhkan pada mengakses memori 2,93 rata-rata per paket. Mengingat throughput memori untuk Single / Wide dan Dual / Persempit arsitektur dibahas sebelumnya, tarif maksimum dan throughput paket untuk dua arsitektur dapat dihitung seperti yang ditunjukkan pada Tabel 1 di atas.

Tabel ini menyoroti dampak perbedaan memori arsitektur antara Single / Wide dan Dual / pendekatan sempit. Pendekatan / Single Wide hanya pada 66% dari garis menilai dengan DDR2-667, dan tidak dapat mencapai 10G full-duplex bahkan dengan memori DDR2-800.

Di sisi lain, arsitektur / Dual Persempit mudah mencapai 10G bahkan dengan memori DDR2-400 paling lambat, dan dengan standar memori DDR2-667 arsitektur memberikan lebih dari dua kali lipat dari kinerja memori yang diperlukan untuk 10GbE full duplex, sehingga menyediakan ruang kepala yang signifikan untuk lookup tambahan dan fungsi-fungsi lanjutan.

Alasan perbedaan besar antara kedua arsitektur dapat ditemukan dalam cache perbedaan baris. The / Single Wide dirancang dengan pendekatan yang luar biasa besar garis cache 128-byte, tapi jaringan yang khas dan paket aplikasi pengolahan membutuhkan lookup 32-byte hanya 8 - dan.

Akibatnya, sebagian besar setiap baris cache yang terbuang. Arsitektur / Dual sempit, di sisi lain, memiliki ukuran cache garis 32-byte yang lebih erat sesuai apa yang dibutuhkan dalam jaringan yang khas dan aplikasi paket pengolahan dan hasil kinerja tinggi.

Akses memori Anggaran. Cara kedua untuk melihat masalah ini adalah untuk menghitung jumlah akses memori DDR diizinkan per paket pada 10G dupleks penuh. Dengan 32.900.000 paket per detik, dengan / Single Wide arsitektur memungkinkan mengakses memori DDR 1,9 per paket, sedangkan arsitektur / Dual DDR 6 Persempit izin akses memori per paket. Sekali lagi, arsitektur / Dual Persempit memberikan performa yang jauh lebih tinggi.

Ringkasan
Ketika dievaluasi terhadap load balancing sederhana / aplikasi NAT, bahkan ketika sangat dioptimalkan untuk membutuhkan akses kurang dari 3 memori per paket, pendekatan / Single Wide tidak bisa memberikan 10GB garis kinerja tingkat full duplex, sedangkan arsitektur / Dual Persempit menyediakan dua kali lookup diperlukan bandwidth.

Sebagian besar paket aplikasi pengolahan jauh lebih kompleks dari ini penyeimbang beban sederhana / NAT aplikasi dan melakukan pencarian yang lebih dan memerlukan pembaruan statistik.

Di samping itu, analisis ini tidak mencakup biaya overhead untuk pemrosesan lambat-jalan, manajemen cepat jalan, atau keamanan pengolahan, yang menunjukkan bahwa kinerja sejati pendekatan / Single Wide akan bahkan lebih rendah dari dianalisis di sini. Pada akhirnya, / Dual Persempit arsitektur yang dibutuhkan untuk mencapai tingkat garis 10Gbps dan di atas dalam jaringan dan aplikasi paket pengolahan.