Página Inicial



twitter

Facebook

  Notícia
|

 

MANTLE E DIRECTX 12: IMPACTO NA PERFORMANCE PODE ULTRAPASSAR OS 100% DE GANHO

13/02/2015

Ainda não temos a capacidade de testar de forma direta o impacto que o DirectX 12 irá trazer para a performance do sistema, ou compará-la ao que aMantle é capaz de fazer. Apesar do Windows 10 Techincal Preview trazer embarcado a nova versão da API, muitos dos componentes ainda não estão ativos e, principalmente, os games e ferramentas de benchmark ainda operam apenas em DirectX 11. Porém, o Anandtech consegiu ter acesso antecipado a uma ferramenta já operando em ambas as novas tecnologias: o benchmark Star Swarm, e com ele foi possível ter uma ideia do que está por vir com as novas tecnologias.

Veja como está o novo Windows 10 Technical Preview

Entendendo o gargalo

A escolha do software não é ocasional. Inicialmente a Oxide lançou esta aplicação para demonstrar a potencialidade da engine Nitrous, porém ela possui uma característica muito importante: uma quantidade "abusiva" de draw calls. Em uma simplificação, podemos dizer que as draw calls são o comando enviado do processador para a placa de vídeo "pedindo" a renderização de um objeto. Com as GPUs aumentando sua performance em um ritmo muito superior ao dos processadores, hoje em dia o gargalo em uma cena pode acontecer na CPU: ela é incapaz de realizar estes pedidos na mesma quantidade que a GPU é capaz de renderizá-los.

Uma otimização das draw calls está entre os principais trunfos do ganho de performance da Mantle e, espera-se, também será do DirectX 12, especialmente nas situações em que temos uma placa de vídeo com alta performance combinada com um processador não tão bom assim. Isto também amplia as capacidades dos desenvolvedores, que hoje trabalham com a média de 3 a 5 mil draw calls por frame, e que de acordo com a AMD teriam disponíveis ao menos 100 mil através da Mantle.

Para você entender porque o Swarm é tão bom em fazer draw calls, basta ver um trecho da demonstração: o número de objetos que aparecem na tela é massivo, em alguns momentos:

Os resultados dos testes 

Apesar de encontrar bastante inconsistências ao longo dos testes, o Anandtech descobriu que o modo estratégico do jogo, o RTS, apresentou uma performance consistente o bastante para colocar as duas APIs e várias placas de vídeo para "correr".

Mesmo com um bom processador (Core i5-4670K, com quatro núcleos e quatro threads operando em 3.8GHz) o Anandtech encontrou uma evolução notável na performance com as novas APIs, tanto com Mantle quanto com DirectX 12, como vocês conseguem conferir no gráfico abaixo. 



Em geral, a Mantle conseguiu um pouco mais de desempenho que a nova API da Microsoft. As placas da Nvidia utilizaram apenas o DirectX, já que a Mantle é voltada a placas de vídeo baseadas na arquitetura GCN da AMD. É notável que, quanto mais performance da placa, ou seja, maior aquele "gap" entre o que a GPU e a CPU são capazes de fazer, maior é o impacto que a nova API causa na performance, sendo que o grande destaque é o salto no desempenho da GTX 980, ultrapassando os 100% de ganho.

No teste seguinte, o site escalonou o teste entre um processador com dois (Core i3-4370 operando em 3.8GHz) quatro (Core i5-4670K em 3.8GHz) e seis núcleos (Core i7-4960X em 4.2GHz), para perceber o quanto a API representaria um ganho de acordo com a performance do processador.

Tanto com Nvidia quanto AMD, e a API sendo tanto Mantle e DirectX 12, o salto de performance foi notável. Outra característica que chama a atenção é a diferença entre os processadores: em vários momentos, um Core i5 desbloqueado e um Core i7 da linha Extreme com overclock trazem um resultado semelhante, e até mesmo o Core i3, com apenas dois núcleos e bloqueado para overclock, não ficou longe de seus pares muito mais potentes (e caros).

Muitas vezes esquecido por conta de seu "irmão mais famoso", os quadros por segundo (FPS), o tempo de quadro (frametime) também aparece no comparativo do Anandtech. Ele tem importância ao mostrar de forma mais consistente a fluidez com que os quadros são renderizados, já que mesmo dentro de um sistema renderizando na casa dos 60fps, pode haver flutuações que cada quadro levou para ser gerado dentro deste período de um segundo. Diferente dos FPS, em frametime o MENOR é o MELHOR.



Novamente as novas APIs trouxeram um impacto excelente, sendo bem equilibrado o que entregaram com a R9 290X. Não se engane pela escala: a GTX 980 se saiu muito melhor neste teste, sendo que a Mantle foi capaz de emparelhar o jogo entre as duas placas, mas bastou a GTX 980 utilizar o DirectX 12 para ficar em vantagem novamente.

A prova definitiva de onde fica a eficiência das novas APIs está neste último teste: o batch submission, algo que simplificando um tanto seria o tempo que o processador leva para fazer pedidos à GPU. Aqui novamente MENOS é MELHOR.


O resultado tira qualquer dúvida sobre onde está o trunfo de performance das novas tecnologias. O tempo necessário para o envio de pedidos caiu de 112 milissegundos para apenas 4 milissegundos na R9 290X. Neste teste, por sinal, o DirectX 12 ficou em vantagem, levando em torno da metade do tempo para cada processo.

Conclusão

Os resultados são muito animadores, pois mostram a grande eficiência que os softwares ganharão com as novas APIs, acessando de forma mais eficiente o potencial que já está disponível no hardware mas que por problemas de otimização não é utilizado. O aumento de draw calls possíveis de forma exponencial traz novas capacidades para os desenvolvedores de games, que terão uma nova margem para inserir objetos na tela em cenas complexas.

Mas há um porém, antes de sair comemorando: o uso do Swarm explora exatamente a situação ideal para uso do novo potencial das APIs. O benchmark usou uma cena muito carregada, com uma quantidade absurda de objetos na tela. Em outros games, com um número mais moderado de objetos para "serem desenhados" pelo hardware, o impacto na retirada do gargalo da CPU não será tão marcante. Franquias de estratégia, como a série Total War ou Civilization, estão entre os games que potencialmente mais irão explorar esta nova capacidade de desenhar objetos na tela sem comprometer a performance.

Termos uma noção mais clara dos efeitos do DirectX 12 no futuro. A Microsoft deve trazer mais novidades durante a GDC 2015, que acontece no começo do mês que vem. Os primeiros games com a nova API devem surgir ainda este ano, enquanto ferramentas de benchmark capazes de lidar com tanto Mantle quanto DirectX 12 já estão a caminho.
 
 
 
Fonte: Adrenaline

 
Indique esta notícia Indique esta notícia para um amigo

Início Notícias  | Voltar