Intel sẽ "đè bẹp" Nvidia và ATI với Larrabee ?!!!

Thảo luận trong 'Card Đồ họa - Video Cards' bắt đầu bởi Bakalu, 2/3/09.

  1. Bakalu

    Bakalu New Member

    Bài viết:
    4,972
    Nơi ở:
    Raccoon City
    Không hoàn toàn là Pentium cũng không là Atom chỉ đơn giản là Larrabee

    Intel đã đưa ra đầy đủ những thông tin về Larrabee để có thể cùng nhau thảo luận nhưng vẫn không đủ để có thể đưa ra bất kỳ một kết luận nào. Chúng ta sẽ bắt đầu với những cái chúng ta đã biết.

    Larrabee được xây dựng dựa trên những nhân x86 ở mức rất cao như sau :

    [​IMG]

    Mỗi nhân là một cặp đơn vị xử lý dựa trên kiến trúc của bộ vi xử lý Pentium nguyên thủy. Nhân Pentium này được bổ sung thêm hỗ trợ những phép tính 64-bit, cập nhập những bộ lệnh x86, bộ đệm lớn hơn, siêu phân luồng 4 đường và vector ALU 16-wide.

    So với nhân Atom thì nhân Larrabee có vài khác biệt đáng kể. Nhân Atom được thiết kế tập trung mạnh về xử lý đơn luồng, với đường ống (pipeline) sâu hơn, bộ đệm cache L2 lớn hơn và thêm vào việc tối ưu để cải thiện hiệu năng cho vi kiến trúc này để đạt được hiệu năng tương tự như CPU cho máy để bàn.

    [​IMG]

    Nhân Larrabee theo cách khác nó giống nhiều nhân Pentium nguyên thủy, Intel đã nói rõ rằng đường ống thực thi của Larrabee ngắn, độ sâu của đường ống khoảng 5 tầng (5-stage) tương tự như nhân Pentium nguyên thủy trong khi với Atom thì đường ống có độ này có độ sâu là 16 tầng. Cả Atom và Larrabee hỗ trợ siêu phân luồng, Larrabee có thể làm việc đến 4 luồng đồng thời so sánh với 2 trên Atom và 1 trên bộ vi xử lý Pentium nguyên thủy.

    Bộ đệm cache L1 của Larrabee và Atom tương tự nhau, nhưng Larrabee có đầy đủ 32KB bộ đệm dữ liệu so với của Atom là 24KB. Dung lượng bộ đệm L1 của Larrabee lớn gấp 4 lần so với bộ đệm của Pentium nguyên thủy.

    Pentium không có bộ đệm cache L2 trên cùng đế của bộ vi xử lý, mà nó sẽ dựa vào SRAM (RAM tĩnh) bên ngoài được gắn trên Mainboard do đó với Atom để đạt được hiệu năng tốt như các bộ vi xử lý cho máy để bàn, Atom được trang bị bộ đệm cache L2 là 512KB, trong khi với mỗi nhân Larrabee là 256KB. Kiến trúc Larrabee được nhấn mạnh ở điểm quan trọng là dung lượng lớn và tốc độ của bộ đệm, 256KB là một dung lượng hợp lý cho kiến trúc Larrabee. Larrabee mặc định sẽ dựng hình OpenGL/DirectX là những ô vuông có kích thước 64x64 hoặc 128x128 với 32 bit màu vừa khít trong một khoảng dung lượng 128KB, việc thêm vào cho bộ đệm 128KB là để dành cho phần dữ liệu. Và nên nhớ kỹ rằng đây là cho một nhân Larrabee - trong khi cả GPU Larrabee sẽ bao gồm rất nhiều nhân.

    Một sự khác nhau lớn nữa giữa Larrabee, Pentium và Atom đó là khía cạnh thực thi có hướng. Bộ vi xử lý Pentium nguyên thủy không có đơn vị xử lý SIMD, Atom thêm vào hỗ trợ SSE và Larrabee thực hiện một bước cải tiến rất lớn đó là vector ALU 16-wide. Đây là đơn vị xử lý có khả năng làm việc đến 16 phép tính dấu chấm động 32-bit đồng thời. Và còn một thay đổi khác nữa so với nhân Pentium nguyên thủy là Larrabee cũng thêm vào hỗ trợ 64-bit x86.

    Chú thích :

    * ALU là tên viết tắt của Arithmetic Logic Unit (đơn vị luận lý số học). ALU là một khối cơ bản của bộ vi xử lý CPU và thậm chí nó còn là nhiều bộ xử lý đơn giản nhất đảm nhiệm 1 mục đích. Bộ vi xử lý trung tâm CPU và bộ xử lý đồ họa GPU chứa đựng rất nhiều ALU. Hầu hết các phép tính của bộ xử lý được thực hiện bởi một hoặc nhiều ALU. ALU có thể thực hiện các phép tính đơn giản (như cộng, trừ, nhân, chia, lệnh AND, NOT, OR, XOR và các phép toán trên hệ nhị phân) và phép tính phức tạp (như căn bậc hai...).

    * SIMD là viết tắt của Single Instruction, Multiple Data (đơn lệnh đa dữ liệu) là khả năng thao tác nhiều dữ liệu song song. Một ví dụ đơn giản nhất là thay đổi độ sáng hình ảnh, mỗi điểm ảnh của một hình ảnh nào đó bao gồm 3 giá trị độ sáng của 3 màu đỏ, xanh dương và xanh lá cây, thay đổi độ sáng của hình ảnh có nghĩa là thay đổi độ sáng của 3 mầu này cùng lúc.
     

    Các file đính kèm:

  2. omoke

    omoke Well-Known Member

    Bài viết:
    2,226
    larrabee công nhận là một ý tưởng khá hay, một biến thể vượt trội hay một quái thai thì không thể biết lúc này, và chiện có "đè" được đối thủ "bẹp" hay không thì lại chờ tiếp.
     
  3. David-Duc

    David-Duc n00b...newbie ?

    Bài viết:
    789
    Nơi ở:
    Saigon
    Pipeline stage thành "Độ sâu đường ống" :lay:, nên để nguyên English nghe đỡ hơn :sun:
     
  4. Bakalu

    Bakalu New Member

    Bài viết:
    4,972
    Nơi ở:
    Raccoon City
    ko phải là Pipeline stage mà Pipeline Depth vậy Pipeline Depth dịch làm sao ? Bro có từ dịch thuật nào hay hơn chăng, nhân đây cho hỏi luôn dual-issue dịch làm sao là hay và sát nghĩa nhất.
     
  5. unicornboy

    unicornboy Cố spam lên rồng

    Bài viết:
    1,815
    Thì nhân cho 2.9Ghz rồi còn gì.
     
  6. David-Duc

    David-Duc n00b...newbie ?

    Bài viết:
    789
    Nơi ở:
    Saigon
    Vậy thì để nguyên tên gọi gốc, dịch ra TV rồi tới lúc người đọc cần tìm tài liệu liên quan lại phải vò đầu bứt tóc mà kiếm ngược lại tên gọi tiếng Anh.
     
  7. Bakalu

    Bakalu New Member

    Bài viết:
    4,972
    Nơi ở:
    Raccoon City
    So sánh kỹ hơn với kiến trúc card đồ họa của AMD và nVIDIA

    Qua những thông tin mà tôi đã cung cấp cho mọi người có thể thấy rằng nhân x86 của Larrabee rất phức tạp xem biểu đồ dưới đây khối bên trái là sơ đồ nhân Larrabee còn khối bên phải là hình phóng to đơn vị xử lý có hướng (vector unit) và những thành phần liên kết với nó :

    [​IMG]

    Đơn vị xử lý có hướng bao gồm rất nhiều thanh ghi và những vector ALU mà từ đó sẽ dựng nên nguyên khối Larrabee. Chip GT200 của nVIDIA được dựng nên từ những bộ xử lý dòng, chip RV770 của AMD từ những đơn vị xử lý dòng và hiệu năng của Larrabee sẽ đến từ những vector ALU 16-wide :

    [​IMG]

    Một vector ALU có thể xử lý tương tự như là 1 ALU 16-wide hoặc 2 ALU 8-wide. Hình so sánh khối xử lý của kiến trúc card đồ họa của ATI, NVIDIA và Larrabee :

    [​IMG]

    Những bộ xử lý dòng của nVIDIA làm việc trên một phép tính, của AMD là 5 và đơn vị xử lý có hướng của Larrabee có thể làm việc với 16 phép tính. Những chip đồ họa cao cấp của nVIDIA có trên 200 bộ xử lý dòng, của AMD là 160 và chip Larrabee của Intel ước lượng sẽ có khoảng từ 16 đến 32 nhân.

    Chúng ta đã biết rằng kiến trúc của AMD yêu cầu rất nhiều sự giúp đỡ từ những chương trình biên dịch để tận dụng được tối đa tài nguyên thực thi bên trong các bộ xử lý dòng, với Larrabee những chương trình biên dịch còn có ý nghĩa quan trọng hơn gấp bội, nhưng thật may mắn cho Larrabee, những chương trình biên dịch đều được chính Intel làm.

    Những đơn vị xử lý có hướng của Larrabee được sắp xếp linh hoạt. Từ những thông tin đã có, cho thấy rằng những đơn vị xử lý có hướng này có thể thực thi 16 phép tính cơ bản cho đơn luồng của những chương trình đang chạy và có thể quản lý tất cả 16 đơn vị thực thi. Chúng ta đã nhìn thấy sự khác nhau giữa kiến trúc đồ họa của AMD và nVIDIA đã dẫn đến những ưu thế cũng như những bất lợi đối với những game khác nhau. Nếu Intel có thể làm cho đơn vị xử lý có hướng trong chip đồ họa Larrabee phù hợp được với những ứng dụng hiện tại thì họ sẽ có ưu thế lớn. Một lần nữa chúng ta không có đủ thông tin chi tiết để có thể dự đoán điều gì sẽ xảy ra nhưng mọi thứ trông có vẻ rất hứa hẹn.
     

    Các file đính kèm:

  8. vietthanhpro

    vietthanhpro New Member

    Bài viết:
    411
    2.9x10^9 là cái quái gì thế bro.:detien:
    Chờ RV870 và GT300 thế nào rồi tính tiếp. Nhưng với tình hình hiện tại thì RV970 và GT400 thì Larabee mới ra mất.:lay:
    SP của AMD còn có cả khả năng rẽ nhánh với ghê chứ.:lol:
     
  9. Tesla

    Tesla noob master

    Bài viết:
    1,331
    Nơi ở:
    in hell
    Theo lý thuyết của sơ đồ trên thì intel ăn đứt Ati và nVidia rồi còn gì :kinhdi: nhưng cái quan trọng là phải đợi thực tế kiểm nghiệm lại xem thế nào đã, hy vọng vẫn chỉ là hy vọng thôi.
     
  10. Bakalu

    Bakalu New Member

    Bài viết:
    4,972
    Nơi ở:
    Raccoon City
    Sự trở lại của tuyến Ring Bus

    Intel vẫn giữ 2 chi tiết quan trọng của Larrabee trong sự bí mật đó là chi tiết thiết lập lệnh và cấu hình cuối cùng của sản phẩm. Nên nhớ rằng Larrabee sẽ không thể tung ra thị trường trước năm 2009 mà thậm chí là năm 2010, chip đầu tiên thậm chí chưa có trong phòng thí nghiệm do đó không thể biết chip đồ họa Larrabee sẽ có bao nhiêu nhân.

    Sản phẩm cuối cùng là tập hơp của dãy 8 nhân Larrabee, chúng ta trông đợi sẽ thấy chip đồ họa này sẽ có khoảng từ 24 đến 32 nhân.

    [​IMG]

    Biểu đồ phía trên của Intel cho thấy rằng có 2 phần bộ điều khiển bộ nhớ, cả hai hãng AMD và NVIDIA đều sử dụng cấu trúc bộ điều khiển bộ nhớ 64-bit và đơn giản là nhóm nhiều phần 64-bit này lên trên một chip. Chip Larrabee của Intel sẽ có hiệu quả băng thông bộ nhớ hơn cả sản phẩm của hai hãng AMD và NVIDIA , hoàn toàn có thể Larrabee sẽ có giao diện bộ nhớ đến 128-bit và có thể là 256-bit cùng với hỗ trợ GDDR5.

    Tất cả những nhân của Larrabee sẽ được kết nối với nhau qua những tuyến ring bus có hướng (512-bit theo mỗi hướng) và có thể chạy cùng xung của nhân. Larrabee có xung khoảng 2GHz điều này để cho thấy rằng băng thông bus bộ nhớ sẽ rất cao.

    AMD gần đây đã bỏ đi kiến trúc bộ nhớ tuyến ring bus để tiết kiệm tiết diện đế chip xử lý. Kiến trúc tuyến ring-bus của Intel có thể sẽ tốt hơn giải pháp của AMD là do hai thành phần đó là bộ đệm liên kết và các nhân xử lý liên lạc với nhau. Phần bộ đệm L2 sử dụng trong tuyến ring-bus đảm bảo cho dữ liệu được vận chuyển dễ dàng và thuận tiện hơn. Trong khi chip Cell cũng cho phép các nhân xử lý liên lạc với nhau, thì giải pháp của Intel đó là cung cấp khả năng truy cập trực tiếp với độ trễ thấp, liên kết các phần bộ đệm L1 và L2 trong khi vẫn đảm bảo cung cấp một băng thông lớn phía sau bộ đệm L2 giúp cho chia sẻ dữ liệu của các chương trình được dễ dàng và nhanh chóng.
     

    Các file đính kèm:

Chia sẻ trang này