Các cải tiến chính tạo nên sức mạnh của Conroe

Thảo luận trong 'intel' bắt đầu bởi amdsempron, 7/7/06.

  1. amdsempron

    amdsempron Fann Wong's crazy fan

    Bài viết:
    1,778
    Nơi ở:
    Anywhere where Fann Wong is
    Conroe hiện đang là một chủ đề hot trong giới đam mê hardware trên thế giới bởi sức mạnh không cần phải bàn cãi của nó. Trên 4rum của chúng ta cũng có khá nhiều các anh em đang háo hức để tậu cho mình một PC mới dựa trên nền tảng CPU Conroe. Trong thread này tôi muốn giới thiệu một cách tổng quát các cải tiến chính tạo nên sức mạnh của Conroe hay nói chính xác hơn là của kiến trúc Intel Core Microarchitecture cũng như so sánh giữa 2 kiến trúc Intel Core Microarchitecture và AMD K8.

    1 - Tiêu chuẩn đánh giá một CPU :

    Hiệu năng :

    Performance = Frequency x Instructions Per Cycle (IPC)

    Từ công thức trên có thể thấy để tăng hiệu năng của CPU thì có thể tăng Frequency (dễ thấy nhất) hoặc có thể tăng IPC, IPC phụ thuộc vào kiến trúc của CPU (số các instruction decoder và excution block).

    Một cách khác để tăng hiệu năng của CPU là giảm số thao tác cần để xử lý cùng một lượng dữ liệu, đây chính là trường hợp của các tập lệnh SIMD như SSE, SSE2, SSE3.

    Điện năng tiêu thụ :

    Power = Frequency x Voltage x Voltage x Cdynamic

    Cdynamic là hằng số phụ thuộc vào kiến trúc của CPU, số transistor và hoạt động của chúng trong suốt quá trình hoạt động của CPU.

    [​IMG]

    Từ 2 công thức trên ta có thể thấy các nhà thiết kế CPU phải tìm ra điểm cân bằng giữa IPC và Cdynamic để tối ưu hóa kiến trúc của CPU sao cho đạt được tỷ số performance/power là tốt nhất. Voltage cũng có ảnh hưởng rất lớn đến tỷ số này nhưng nó phụ thuộc phần lớn vào quy trình sản xuất chứ không phải kiến trúc của CPU và frequency cũng không ảnh hưởng nhiều đến tỷ số này.

    Từ những lý do trên mà Intel phải từ bỏ kiến trúc NetBurst (ra đời vào năm 2000 với dòng CPU Pentium 4 nổi tiếng) và đầu tư vào nghiên cứu một kiến trúc mới nhằm cạnh tranh với kiến trúc K8 của AMD (vốn chiếm ưu thế so với kiến trúc NetBurst), kiến trúc mới này gọi là Core Microarchitecture dùng chung cho desktop (Conroe), laptop (Merom) và server (Woodcrest).

    2 - Cơ bản về Intel Core Microarchitecture :

    Core Microarchitecture có khả năng xử lý tối đa 4 instruction trên một clock cycle, nhanh hơn bất kỳ CPU nào hiện có. Excution pipeline của Core Microarchitecture có 14 stage, ngắn hơn nhiều so với Prescott, Smithfield, ... thuộc kiến trúc NetBurst (với hơn 30 stage). Nếu xét về performance per watt thì pipeline ngắn hơn có một lợi thế không cần phải bàn cãi.

    [​IMG]

    Core Microarchitecture là native dual core, gồm 2 core nằm trên cùng một die, có 64 KB L1 Cache (32 KB cho instruction và 32 KB cho data), support EM64T không như Pentium M và Core Duo (Yonah) chỉ support tính toán 32 bit.

    Core Microarchitecture được thiết kế cho nhiều phân khúc thị trường khác nhau. Intel cam kết chỉ cần giảm 15 % frequency thì peak power consumption giảm đến 50 %. Khả năng này cho phép sản xuất các dòng CPU cho các phân khúc thị trường desktop, laptop và server dựa trên Core Microarchitecture. Merom sẽ nhanh hơn thế hệ CPU cho laptop hiện tại của Intel là Core Duo (Yonah) khoảng 20 %, power consumption không vượt quá 35 W. Woodcrest sẽ nhanh hơn thế hệ Xeon hiện tại khoảng 80 %, power consumption khoảng 80 W (giảm 35 %). Conroe sẽ nhanh hơn Pentium D 900 series khoảng 40 %, power consumption của Conroe dòng mainstream khoảng 65 W (giảm 40 %).

    3 - Intel Wide Dynamic Excution :

    Bằng cách thêm vào một decoder và các excution unit vào mỗi core, công nghệ Wide Dynamic Excution cho phép Core Microarchitecture xử lý tối đa 4 instruction trên một clock cycle (nhanh hơn bất kỳ dòng CPU hiện tại nào của Intel và AMD vốn có khả năng xử lý tối đa 3 instruction trên một clock cycle).

    [​IMG]

    Công nghệ macrofusion cho phép gia tăng số lệnh được xử lý trên một clock cycle. Một tập các cặp x86 instruction như lệnh so sánh theo sau bởi một lệnh rẽ nhánh theo điều kiện, sẽ được xem như một microinstruction và scheduler sẽ thực thi microinstruction này như một single command.

    [​IMG]

    Nhìn hình trên ta có thể thấy 2 instruction jne targ và cmp eax, [mem2] được ghép lại thành một microinstruction là cmpjne eax, [mem2], targ.

    4 - Intel Advanced Digital Media Boost :

    Các software hiện tại như image, video, audio editing, data encryption, ... dùng rất nhiều các SSE instruction hỗ trợ toán hạng 128 bit. Các CPU hiện tại của Intel cần đến 2 clock cycle để xử lý một SSE instruction toán hạng 128 bit (64 bit cho một clock cycle). Kiến trúc mới Core Microarchitecture có khả năng xử lý SSE instruction toán hạng 128 bit chỉ trong một clock cycle. Việc này sẽ giúp tăng tốc các ứng dụng dùng nhiều SSE instruction. Bên cạnh đó, Intel có thể sẽ thêm vào các lệnh SSE mới.

    [​IMG]

    5 - Intel Advanced Smart Cache :

    Core Microarchitecture là CPU native dual core, không như các CPU dual core dòng Pentium D 800, 900 series có L2 cache riêng cho từng core, CPU dựa trên Core Microarchitecture sẽ có L2 cache dùng chung cho cả 2 core, công nghệ này có thể thấy trong các CPU dual core hiện tại của Intel dành cho laptop là Core Duo (codename Yonah). Công nghệ này cho phép điều chỉnh tự động dung lượng L2 cache cho từng core tùy vào tần suất truy xuất L2 cache của từng core. Đặc biệt, nếu cả 2 core cùng làm việc một cách đồng bộ trên cùng một dữ liệu thì dữ liệu này sẽ được lưu một lần tại một nơi trên L2 cache. Thiết kế này đem lại hiệu quả cao hơn so với thiết kế dành riêng cho mỗi core một L2 cache riêng.

    Một điểm mạnh khác của L2 cache chia sẻ là giảm tải cho bộ nhớ và bus hệ thống. Giả sử tại một thời điểm nào đó, cả 2 core đều làm việc trên cùng một data. Với thiết kế dual core có L2 cache riêng cho từng core thì sẽ có 2 bản sao của data này trên L2 cache của từng core. Trước khi mỗi core truy xuất bản sao của data trên L2 cache của mình, nó phải đảm bảo đó là bản sao mới nhất của data tại thời điểm đó (vì có thể data đã được cập nhật bởi core còn lại), do đó sẽ có một quá trình update bản sao này diễn ra và quá trình này phải thông qua bộ nhớ và bus hệ thống. Với thiết kế L2 cache chia sẻ thì không cần phải update vì data được lưu một lần tại một nơi trên L2 cache chia sẻ giữa 2 core. Khi một core truy xuất data trên L2 cache chia sẻ thì data đó là mới nhất tại thời điểm đó.

    [​IMG]

    6 - Intel Smart Memory Access :

    Công nghệ Smart Memory Access cải tiến việc nạp trước dữ liệu. Kiến trúc Core Microarchitecture có 6 đơn vị nạp trước dữ liệu, 2 đơn vị cho việc nạp trước dữ liệu từ bộ nhớ vào L2 cache chia sẻ, 2 đơn vị cho việc nạp trước dữ liệu vào L1 cache của mỗi core. Các đơn vị này hoạt động độc lập và theo dõi các hoạt động truy xuất bộ nhớ của các excution unit và cố gắng nạp trước dữ liệu vào cache thậm chí trước khi có yêu cầu truy xuất tương ứng và dữ liệu được truy xuất trực tiếp từ cache (L1, L2) dĩ nhiên sẽ nhanh hơn so với từ bộ nhớ.

    Smart Memory Access cũng bao gồm công nghệ memory disambiguation, giúp nâng cao hiệu quả của việc truy xuất bộ nhớ. Trong đa số trường hợp, các lệnh truy xuất bộ nhớ được thực thi theo thứ tự như khi chúng được đưa vào hàng đợi lệnh. Tuy nhiên trong số các lệnh truy xuất bộ nhớ đó có những lệnh hoàn toàn độc lập với nhau và công nghệ memory disambiguation sẽ phát hiện các lệnh như vậy và sắp xếp lại thứ tự thực thi của các lệnh này sao cho tối ưu, qua đó nâng cao hiệu quả truy xuất bộ nhớ.

    [​IMG]

    7 - Intel Intelligent Power Capability :

    Công nghệ Intelligent Power Capability giúp giảm điện năng tiêu thụ của các CPU dựa trên kiến trúc Core Microarchitecture. Các CPU dựa trên kiến trúc Core Microarchitecture có thể chia ra thành các thành phần nhỏ hơn và các thành phần này được cấp điện một cách riêng biệt. Khi có thành phần nào ở trạng thái idle thì CPU sẽ đưa thành phần đó vào trạng thái “ngủ đông” để giảm điện năng tiêu thụ.

    8 - So sánh giữa 2 kiến trúc Intel Core Microarchitecture và AMD K8 :

    [​IMG]



    Source tham khảo :
    X-bit labs
    PC Perspective

    Post có thể còn nhiều điều khiếm khuyết, mong anh em thông cảm và đóng góp dùm ! :welcome:
     
    :
  2. hahaivu

    hahaivu Noob killer

    Bài viết:
    415
    Nơi ở:
    HCM-VN
    ^_^ post hay đó vote 1 phiếu
     
  3. Jedi Knight

    Jedi Knight Hiệp sĩ mù....dở

    Bài viết:
    890
    Bổ sung thêm thông tin: kiến trúc này được nhóm Intel Isarel thiết kế.

    Bài dịch rất hay, nếu được dịch thêm phần kiến trúc K8 để cho anh em so sánh.
     
  4. dino

    dino Khủng long con tham ăn

    Bài viết:
    637
    Nơi ở:
    http://www.dinolovena.com
    :lacdau: bọn Do Thái này giỏi thật ...
     
  5. amdsempron

    amdsempron Fann Wong's crazy fan

    Bài viết:
    1,778
    Nơi ở:
    Anywhere where Fann Wong is
    Core Microarchitecture do nhóm kỹ sư người Israel của Intel thiết kế ! nhóm này cũng là nhóm thiết kế kiến trúc của Pentium M đó !

    @dino : Albert Einstein là người Do Thái đó ! công nhận người Do Thái thông minh thật ! :lay:
     
  6. athlon26

    athlon26 giã từ vũ khí

    Bài viết:
    932

    cho tui nhảy vào ké 1 chút :kiss:




    Vậy là theo công thức trên sức mạnh CPU phụ thuộc vào tốc độ (frequency) và IPC (số instruction thực hiên được trong 1 cycle)


    để tăng sức mạnh cho CPU thì 1 trong 2 cách là tăng frequency , tức tăng độ dài pipeline lên , ppipeline càng nhiều tầng thì frequency max có thể đạt được càng lớn .


    tuy nhiên khi tăng độ dài pipeline thì này sinh vẫn đề là số IPC bị giảm xuống (các yếu tố khác giữ nguyên ) cái này đại loại là : mỗi lần thực hiện instruction CPU có khả năng phải truy xuất thông tin trong cache và trong bộ nhớ trung tâm , pipeline càng nhiều tầng thì thời gian truy xuất càng dài dẫn đến việc IPC bị giảm đi


    nếu frequency max có thể được đủ lớn để bù được cho sự giảm IPC này thì kiến trúc pipeline dài sẽ mạnh hơn so với kiến trúc pipeline ngắn


    Tóm lại là

    tăng độ dài pipeline
    ----> IPC giảm
    ----> frequency max tăng



    độ dài pipeline của 1 số kiến trúc CPU Intel


    20 tầng với core Willamette và Northwood với frequency tối đa 3,4 GHz

    31 tầng với core Prescott và Cedar Mill frequency max 5 GHz.

    45 tầng với core Tejas frequency max 7 GHz. (cái này lẽ ra là thế hệ CPU đươc Intel tung ra để tiếp bước kiến trúc netburst của Pen4 nhưng cuối cùng Intel đã thay thế nó bằng Core )


    Qua đây có thể thấy rất nhanh vì sao người ta nói Pen4C mạnh hơn Pen4 E , đơn giản bởi vì Pen4 E chưa đạt tới frequency cần thiết để bù lại sự giảm IPC so với Pen4 C . Trên lí thuyết Pen4 E có thể đạt đến tốc độ tối đa 5Gz nhưng vì nhiều yếu tố cản trở như qui trình sản xuất chưa theo kịp dẫn đến hiện tượng CPU tỏa nhiệt và tiêu tốn quá nhiều năng lượng . Ngước lại dòng Pen4 lúc mới được tung ra chạy với frequency dưới 2Ghz cũng chưa tỏ ra thuyết phục , lí do cũng như trên .


    Pipeline càng nhiều tầng thì CPU càng có khả năng mạnh hơn . Tuy nhiên khi đạt tới 1 giới hạn , frequency cao ko thể bù lại sự giảm IPC được nữa . Người ta ước tính được số tầng pipeline tối ưu là vào khoảng 55(!) tức là cao hơn rất nhiều so với kiến trúc netburst hiện nay . Tất nhiên yếu tố tỏa nhiệt và tiêu thụ điện năng chưa được tính đên


    Trong tương lai xa rất có khả năng Intel sẽ phải quay lại với kiến trúc dựa trên pipeline nhiều tầng khi việc tăng IPC ko thể tiếp tục mãi mãi . Bên cạnh việc tăng thêm số core , tốc độ vận hành cao vẫn là yếu tố quan trọng để gia tăng sức mạnh cho CPU . Vì vậy rất có thể Pen4 vẫn chưa "chết" hẳn như nhiều người lầm tưởng. 1 ngày nào đó ae Amtech lại vênh váo với những con CPU Intel 7, 8 Ghz sử dụng tản nhiệt vapochill defaut :detien:
     
  7. philip990

    philip990 New Member

    Bài viết:
    257
    :somot: vote 1phieu S
     
  8. BaeYongJin

    BaeYongJin New Member

    Bài viết:
    161
    bổ sung kiến thức em vừa mới học xong : Sir Einstein là người Đức ( cha Người Đức mẹ Do Thái ) gốc Do Thái sau này õng ghét chủ nghĩa phát xít nên mới rời bỏ Đức sang Mỹ sống ! nên Mỹ lợi dụng cơ hội này mà nói nhà thiên tài bác học Einstein là của Mỹ hic hic công nhận Mỹ láo ghê heheh !:lemat: :lacmong:
     
  9. tranphuloc_amtech

    tranphuloc_amtech New Member Thành viên BQT

    Bài viết:
    2,456
    Nơi ở:
    HCM
    Vậy mốt AMD K9 mà có ra đời chắc nhờ bên Palestine thiết kế quá :ak:
     
  10. Bakalu

    Bakalu New Member

    Bài viết:
    4,972
    Nơi ở:
    Raccoon City
    Và có dẫn chứng thực tế để chứng minh sức mạnh của Conroe, E6400 2.13GHz 2MB Cache đấu với CPU AMD mạnh nhất hiện nay là Dual Core FX62 2.8GHz 2MB Cache :

    [​IMG]
    Source : http://www.hardwareluxx.de/story.php?id=4253

    Kết luận tuy xung của E6400 thấp hơn FX62 gần 700MHz nhưng tính trung bình E6400 nhanh hơn FX62 là 2,57% .
     

Chia sẻ trang này