Tại triển lãm công nghệ điện tử tiêu dùng CES 2010 năm nay, NVIDIA đã giới thiệu một vài công nghệ mới của họ. Trong một cuộc họp báo họ đã công bố trước công chúng công nghệ 3D Vision Surround và Tegra 2, và họ đã cho sản phẩm GF100 trình diễn công nghệ 3D Vision Surround. Và điều quan tâm nhất của mọi người chính là GF100. GPU GF100 dựa trên kiến trúc Fermi cuối cùng cũng đã xuất hiện, NVIDIA đã sẵn sàng để nói chuyện với báo chí về những phần còn lại của GF100, và tại CES 2010 chúng tôi lần đầu tiên đã được xem xét khả năng chơi game của GF100. Trong hội chợ CES, NVIDIA đã tổ chức những buổi họp cho giới báo chí và trong các cuộc họp báo đó, NVIDIA tập trung vào 3 điều: Thảo luận về kiến trúc GF100 có liên quan đến game / người sử dụng GPU, thảo luận về chương trình phát triển quan hệ của họ (bao gồm cả những tai tiếng về khả năng khử răng cưa trong game Batman: Arkham Asylum), và cuối cùng cho xem sức mạnh của GF100 trong một số trò chơi và các ứng dụng. Nhiều bạn có thể đã được thấy các đoạn demo video trên YouTube. Những gì bạn đã không được thấy và những gì chúng tôi sẽ tập trung vào ngày hôm nay, là những gì chúng tôi đã biết được về GF100 như là một GPU dành cho game thủ. Bây giờ là lúc chúng ta sẽ biết tất cả mọi thứ về GF100. Tuy nhiên khi NVIDIA cho xem GF100, chúng vẫn chưa phải là sản phẩm cuối cùng. Và ngay thời điểm này chúng tôi vẫn không thể biết một số thông tin liên quan đến GF100 bao gồm : 1. Kích thước của GPU 2. Những phiên cụ thể nào của GF100 3. Xung đồng hồ 4. Công suất tiêu thụ (chúng tôi chỉ biết rằng nó hơn GT200) 5. Giá cả 6. Hiệu năng Tại thời điểm này các sản phẩm cuối cùng và giá cả sẽ phụ thuộc rất nhiều vào những con chip GF100 cuối cùng. Xung tốc độ của chip GF100 sẽ quyết định việc tiêu thụ năng lượng cũng như hiệu năng. GF100 của NVIDIA rõ ràng là nhằm một mục tiêu nhanh hơn Radeon HD 5870 của AMD. Về hiệu năng, chúng tôi đã được nhìn thấy benchmark game Far Cry 2, chạy demo Ranch Small, và NVIDIA đã chạy demo này trên cả hai card đồ họa là GF100 và GTX285. Card GF100 nhanh hơn (84fps so với 50fps của GTX285), nhưng Ranch Small là một chương trình benchmark rất ngẫu nhiên (các đối tượng xuất hiện không hoàn toàn giống nhau trong mọi trường hợp) và chúng tôi đã nhìn thấy Far Cry 2 phụ thuộc vào CPU trong nhiều trường hợp vì thế chúng tôi không đặt niềm tin nhiều vào chương trình benchmark này. Khi đề cập đến hiệu năng, chúng tôi sẽ chờ cho đến khi được thử nghiệm trên sản phẩm GF100 chính thức. GF100 Kiến trúc dành cho chơi games Trước đây, NVIDIA đã công bố kiến trúc Fermi vào tháng Chín năm 2009, tập trung vào khả năng tính toán của GPU GF100. Ngày nay nVIDIA đã tiết lộ thêm những thông tin về kiến trúc Fermi này. GF100 bao gồm 512 SPs, mà bây giờ NVIDIA gọi là lõi CUDA. 32 lõi CUDA được tổ chức thành một khối được gọi là đa bộ xử lý dòng Multiprocessor Streaming (SM), và kết hợp 4 khối này hình thành một cụm xử lý đồ họa Graphics Processing Cluster (GPC). Có 4 GPCs trong một chip GF100 duy nhất tức là bao gồm 32x4x4 = 512 lõi CUDA. Khi NVIDIA lần đầu tiên công bố GF100, chúng tôi đã không biết gì về ROPs, đơn vị xử lý kết cấu (texture), hoặc bất cứ một đơn vị xử lý có chức năng cố định mà bất kỳ một GPU thông thường nào cũng có. Hôm nay chúng tôi đã có tất cả các thông tin còn thiếu sót đó. Trong khi GF100 giống GT200 như cách tính toán GPU, như là một GPU dành cho chơi game thì sự thay đổi lớn ở đây một khối có chức năng của phần cứng cố định duy nhất đã biến mất. Hầu như tất cả phần cứng đã được phân ra và chuyển xuống một mức độ thấp hơn, và bây giờ có thể tìm thấy nó như là một phần của một GPC hoặc là một SM. Sơ đồ khối của GF100 cụ thể như sau : Những gì còn lại của phần cứng chức năng cố định là GigaThread. Và ở đây chúng ta bắt gặp những đơn vị thực thi mới nhất đó là PolyMorph Engine và Raster Engine. Chúng ta sẽ bắt đầu với Raster Engine. Raster Engine là sự kết hợp của tất cả raster lên quan phần cứng mà chúng ta đã tìm thấy trước đó trong các đường ống chức năng cố định (fixed function pipeline). Nó thực hiện thiết lập cạnh tam giác, rasterization, và z-culling. Mỗi GPC có Raster Engine của riêng nó. NVIDIA nói rất ít về Raster Engine, và chỉ có thay đổi rất ít từ GT200, bên cạnh một thực tế là có 4 đơn vị này (một cho mỗi GPC) mặc dù mỗi khối có kích thước lớn hơn . Mỗi rasterizer có thể xử lý 8 điểm ảnh trong mỗi xung đồng hồ, do đó tổng cộng GF100 sẽ xử lý 32 điểm ảnh trong mỗi xung đồng hồ. Và đơn vị thực thi mới có tầm quan trọng hơn cả đó chính là PolyMorph Engine, đó chính là là đơn vị thực thi xử lý hình học cho GF100. PolyMorph Engine chịu trách nhiệm xử lý khối đỉnh (Vertex Fetch), Tessellation, Viewport Transform, Attribute Setup, và Stream Output. Và Tessellator đã hiện diện, đây là một thay đổi lớn nhất mà DX11 là mang đến cho thiết kế GPU. Không giống như Raster Engine, mỗi SM có một PolyMorph Engine, tức là có tất cả 16 PolyMorph cho toàn bộ GF100. Chúng tôi tin rằng PolyMorph là lý do duy nhất lớn nhất mà GF100 đã không thể được tung ra vào cuối năm ngoái. Đó là thành phần được thiết kế lại nhiều nhất, nhiều hơn bất kỳ thành phần nào khác trong GF100, và nó là cái mà NVIDIA đã phải bắt đầu hầu như từ đầu. Khi NVIDIA đã nói với chúng tôi rằng thiết kế một GPU lớn là khó khăn, thì PolyMorph chính là những gì họ đã tính đến. Bây giờ chúng tôi sẽ thảo luận về các đơn vị đồ họa của GF100. Mỗi SM đã có 4 đơn vị kết cấu (texture units), đã có sự thay đổi so với GT200. Trong GT200, các đơn vị kết cấu nằm ở mức TPC; thì ở đây chúng có trong mỗi SM. Các đơn vị kết cấu cũng bị ảnh hưởng bởi việc sắp xếp lại bộ nhớ cache của GF100; cho bộ nhớ đệm L1 vẫn có cùng 12KB cache kết cấu của mỗi bộ 4 đơn vị kết cấu, trong khi có 768KB cache L2 chia sẻ cho tất cả bộ đệm L2 của GF100, mà bây giờ được sử dụng cho tất cả các đơn vị thực thi và không chỉ là kết cấu. Mỗi đơn vị có thể tính toán 1 địa chỉ kết cấu và lấy 4 mẫu kết cấu trong mỗi xung, cho một tốc độ cao hơn đáng kể so GT200. Hơn nữa cùng với DX11, các đơn vị kết cấu của NVIDIA bây giờ hỗ trợ các định dạng kết cấu nén mới của DX11. Cuối cùng, các đơn vị kết cấu của GF100 được gắn chặt với xung shader chứ không phải như trước đây là với xung lõi (core) và sẽ chạy ở 1/2 tốc độ xung shader của GF100. Cuối cùng thông số cũng được quan tâm khá nhiều là ROPs. ROPs đã được tổ chức lại và được nâng lên 48 ROPs với 6 parttions với 8 ROPs cho mỗi parttion, và một bộ nhớ kênh 64bit phục vụ mỗi phân vùng. ROPs bây giờ chia sẻ bộ nhớ cache L2 với phần còn lại của GF100, trong khi với GT200 ROPs đã có bộ đệm L2 của riêng nó. Mỗi ROP có thể thực hiện một điểm ảnh 32bit cho mỗi xung, 1 điểm ảnh FP16 trên 2 xung, hoặc 1 điểm ảnh FP32 trên 4 xung, cho phép GF100 có khả năng xử lý 48 điểm ảnh thường xuyên trong mỗi xung. ROPs hoạt động cùng xung với bộ nhớ đệm cache L2. Có một lưu ý cuối cùng: xung đồng hồ. Xung nhân (core) tồn tại trên GF100, và bây giờ nó đóng vai trò chỉ như là một phần của xung shader. Chỉ có ROPs và bộ nhớ đệm L2 hoạt động trên xung đồng hồ khác, và xem như là những gì còn lại của xung nhân (core). Xung shader bây giờ sẽ đóng vai trò lớn cho chip GF100, bao gồm xung shaders, xung đơn vị kết cấu (texture units), xung của PolyMorph và Raster Engines. Cụ thể, xung đơn vị kết cấu, xung PolyMorph Engine, và Raster Engine chạy ở 1/2 xung shader (mà NVIDIA là tạm gọi là "xung GPC"), trong khi bộ nhớ đệm L1 và shaders sẽ chạy ở tốc độ đầy đủ bằng với xung shader. Đừng ngạc nhiên nếu việc ép xung GF100 sẽ khác cách ép xung GT200. Tăng tốc xử lý Tessellation Đây là một trong những đặc điểm quan trọng nhất của DX11 và GF100 đã tập trung tăng tốc độ xử lý đối với Tessellation. nVIDIA đã tung ra các demo có ứng dụng Tessellation Và hiệu năng của GF100 hoàn toàn áp đảo gấp nhiều lần HD5870 khi kích hoạt Tessellation trong 2 demo trên Trong demo Heaven benchmark, GF100 nhanh hơn HD 5870 60% ở tốc độ khung hình trung bình và 80% ở tốc độ khung hình minimum. Ở hiệu năng tô bóng hình học với chương trình test Cubemap GF100 nhanh hơn HD5870 4,7 lần. Tăng cường chất lượng hình ảnh với mức khử răng cưa 32X Với GF100 nVIDIA đã lần đầu tiên đưa ra mức khử răng cưa lên đến 32X, đem lại một chất lượng hình cao hơn nhiều so với mức 16X của GT200 16X CSAA của GT200 32X CSAA của GF100 Tuy mang lại hình ảnh đẹp hơn nhưng hiệu năng không bị giảm quá nhiều, so với mức khử răng cưa 8X hiệu năng chỉ giảm 7% Tính năng Ray Tracing Chạy demo Ray Tracing ở độ phân giải 2560*1600, GF100 cho hiệu năng tăng gấp 3 lần so với GTX285. Công nghệ 3D Vision Surround: Trong cuộc họp của chúng tôi với NVIDIA, họ cũng trình diễn công nghệ 3D Vision Surround, được công bố vào lúc bắt đầu hội chợ CES tại cuộc họp báo của họ. Công nghệ 3D Vison Surround vốn không phải là một công nghệ của GF100, nhưng kể từ khi nó được giới thiệu chung với GF100 ở hội chợ CES 2010 nó đã gây sự chú ý cho tất cả mọi người. Chúng ta sẽ mất một chút thời gian để thảo luận về nó. Nếu bạn đã nhìn thấy công nghệ TripleHead2Go của Matrox hay Eyefinity của AMD thì với công nghệ 3D Vision Surround NVIDIA đã thực hiện một ý tưởng lớn cho các trò chơi. Với nó, các game thủ có thể nhận được một cái nhìn nhập vai hơn bởi họ có thể được bao quanh mình với thế giới trò chơi hơn là chỉ duy nhất ở phía trước của họ. NVIDIA cho chúng tôi biết rằng họ đã phát triển công nghệ này từ khá lâu, nhưng chưa thấy đúng thời điểm để giới thiệu ra thị trường. Tuy nhiên với việc xuất hiện những công nghệ TripleHead2Go và Eyefinity từ phía các đối thủ nVIDIA đã thấy đã đến lúc phải giới thiệu công nghệ này. Công nghệ ba màn hiển thị này sẽ có hai tên. Khi nó được sử dụng riêng mình nó, thì NVIDIA gọi là NVIDIA Surround. Khi nó được sử dụng kết hợp với công nghệ 3D Vision, nó được gọi là 3D Vision Surround. Rõ ràng là NVIDIA muốn bạn sử dụng nó với 3D Vison để có được hiệu ứng đầy đủ (và để yêu cầu một GPU mạnh hơn), nhưng 3D Vision không có nghĩa là bắt buộc phải sử dụng nó. Tuy nhiên đó chính là cái khác biệt quan trọng nhất so với AMD, ít nhất là cho đến khi AMD đưa ra công nghệ 3D của riêng họ. Đây có thể xem là một phản ứng bất ngờ từ NVIDIA với Eyefinity. Không giống như AMD đã thiết kế cho dòng card Evergreen từ đầu. NVIDA đã không đưa ra card GF100 có nhiều hơn 2 cổng hiển thị cùng một lúc. Card GF100 sẽ có giới hạn 2 màn hình như truyền thống, có nghĩa là game thủ sẽ cần 2 card GF100 cho chế độ SLI 3 màn hình, và card thứ hai cần thiết để cung cấp kết quả hiển thị cho màn hình thứ 3 và thứ 4. Chúng tôi hy vọng rằng NVIDIA thiết kế thế hệ card tiếp theo sẽ bao gồm khả năng hiển thị 3 màn hình từ một GPU dành cho những hệ thống Surround giá rẻ. nguồn : AnandTech: NVIDIA’s GF100: Architected for Gaming và The next generation of NVIDIA GeForce GPU
GeForce 380 giá dự kiến vào khoảng 499$-549$, trong khi GeForce 360 sẽ có giá 349$-399$ nguồn : BSN:NVIDIA GF100 Fermi芯片成本分析 - 超能网