■掲示板に戻る■ 1- 最新10

ROプレイヤーのためのPC雑談スレ その13

[122:(○口○*)さん (24/06/27 23:31 ID:DuQTdV0u0)]
◆//baz.B252居る?
お前が出てこないとこのスレもコテスレも終わっちゃうんだけど
ていうかコテスレはきららがプリストの話で荒らすしやっぱりお前が必要なんだわ
化け物には化け物をぶつけるしかないしコテスレを助けてくれ


[123: ◆//baz.B252 (24/06/28 01:37 ID:Dl1OEaHm0)]
https://gpuopen.com/learn/cpu-performance-guide/cpu-performance-guide-part1/

macroを使うと最適化しないだと('A`;;)
やはり/DNOMINMAX安定('A`)


[124:(○口○*)さん (24/06/28 11:50 ID:83yyCVLN0)]
◆//baz.B252は早くコテスレをどうにかしてくれ
お前がまともな会話の典型例を示しコテスレ住民を導いてくれ
ていうかきらら潰してくんない?


[125:(○口○*)さん (24/06/28 23:57 ID:8mzwKSdw0)]
AMDがRadeonドライバの深刻な脆弱性を公表 2024年4月9日、AMDはRadeonユーザーモードドライバのDirectX 11シェーダに、任意のコード実行を許す深刻な脆弱性が存在することを明らかにした。 この問題はCisco Talosの研究者から報告を受けたもので、CVE-2024-21972とCVE-2024-21979の2つの脆弱性識別番号が割り当てられている。


そろそろGPUも変え時か
ドライバ更新対象外なのだよ今使ってるやつ


[126: ◆//baz.B252 (24/06/29 13:43 ID:Raa2ZOZW0)]
>>125
任意のcodeというのは、GPUで動くのかCPUで動くのかわからないぜ('A`)
普通にCPUだとは思うが('A`)


[127:(○口○*)さん (24/06/30 11:16 ID:YYbkZDye0)]
◆//baz.B252先生こんなところで何やってるんですか
早くコテスレのきらら退治して健全なスレに戻してよ


[128:(○口○*)さん (24/06/30 18:57 ID:YYbkZDye0)]
◆//baz.B252いる?
コテスレを救ってくれ、お前が居ないとダメなんだわ
哀れなコテスレ民を先生の力で導いてくれ


[129:(○口○*)さん (24/07/05 18:14 ID:JrV38J5J0)]
ここ◆//baz.B252に見捨てられて完全に終わってんな
そろそろ◆//baz.B252をコテスレに誘致したきらら潰さね?
これはPCスレとコテスレの戦争だよ


[130: ◆//baz.B252 (24/07/05 19:07 ID:vlXghMFu0)]
>>123
/arch:avx /O2 の場合のloop内は次のようになる('A`)

macro使用時
$LL4@test:
vmovss xmm1, DWORD PTR [rax-4]
vmovss xmm2, DWORD PTR [rax]
vmovss xmm6, DWORD PTR [rax-8]
vcmpltss xmm0, xmm2, xmm1
vblendvps xmm0, xmm2, xmm1, xmm0
vcomiss xmm6, xmm0
ja SHORT $LN12@test
vcmpltss xmm0, xmm2, xmm1
vblendvps xmm6, xmm2, xmm1, xmm0
$LN12@test:
add rax, 4
cmp rax, rcx
jne SHORT $LL4@test

std::max呼出時
$LL4@test:
vmovss xmm0, DWORD PTR [rax]
vmovss xmm2, DWORD PTR [rax-8]
lea rdx, QWORD PTR [rax-4]
vcomiss xmm0, DWORD PTR [rdx]
cmova rdx, rax
add rax, 4
vmovss xmm1, DWORD PTR [rdx]
vcmpltss xmm0, xmm2, xmm1
vblendvps xmm0, xmm2, xmm1, xmm0
vmovss DWORD PTR result$[rsp], xmm0
cmp rax, rcx
jne SHORT $LL4@test

乱数を与えた際の ja SHORT $LN12@test が重いわけだ('A`)


[131: ◆//baz.B252 (24/07/06 05:31 ID:7BAs1gtj0)]
特定の値をとらないのであればmaxssでもよく、次のように書けるわけだがperformanceが芳しくない('A`)

__m128 a, b, c;
a.m128_f32[0] = *(i - 2);
b.m128_f32[0] = *(i - 1);
c.m128_f32[0] = *i;
result = _mm_max_ss(a, _mm_max_ss(b, c)).m128_f32[0];

$LL4@test:
vmovss xmm0, DWORD PTR [rax-4]
vmovups xmm3, XMMWORD PTR b$99[rsp]
vmovss xmm2, DWORD PTR [rax-8]
vmovups xmm6, XMMWORD PTR a$100[rsp]
vmovss3 xmm3, xmm3, xmm0
vmovss3 xmm6, xmm6, xmm2
vmovups XMMWORD PTR b$99[rsp], xmm3
vmaxss xmm3, xmm3, DWORD PTR [rax]
add rax, 4
vmovups XMMWORD PTR a$100[rsp], xmm6
vmaxss xmm6, xmm6, xmm3
cmp rax, rcx
jne SHORT $LL4@test


次10 前10 最新10
NAME:MAIL:

read.cgi ver5.26 + n2 (02/10/01)