สิ่งตีพิมพ์ในหัวข้อ 'gpu'
Cellular Automata บน GPU พร้อม Julia (พื้นฐาน)
ต้นฉบับ https://blog.devel.faith/posts/celular-automata-on-gpu-julia/
ในโพสต์นี้ เราจะเรียนรู้เกี่ยวกับการเขียนโปรแกรม GPU ขั้นพื้นฐานและ Julia โดยการเขียนโค้ด Game of Life ของ Conway คุณอาจต้องการลองค้นหา "Conway's Game of Life" บน Google ;)
ชีวิตคืออะไร? เวอร์ชั่น Tl;dr
สำหรับการวนซ้ำแต่ละครั้ง
ประชากรน้อย: เซลล์ใดๆ ที่มีเพื่อนบ้านน้อยกว่า 2 คนจะตาย การมีประชากรมากเกินไป: เซลล์ใดๆ ที่มีเพื่อนบ้านมากกว่า 3 คนจะตาย การสืบพันธุ์: เซลล์ใดๆ ที่มีเพื่อนบ้าน 3 ตัวจะมีชีวิตอยู่..
คู่มือที่ครอบคลุมเกี่ยวกับ CPU, GPU และ TPU สำหรับการเรียนรู้เชิงลึก
ซีพียู (หน่วยประมวลผลกลาง):
CPU คือโปรเซสเซอร์อเนกประสงค์ที่พบในคอมพิวเตอร์ส่วนใหญ่ ได้รับการออกแบบมาเพื่องานที่หลากหลายและเป็นเลิศในการประมวลผลตามลำดับ CPU มีคอร์ที่ทรงพลังเพียงไม่กี่คอร์ที่สามารถจัดการกับคำสั่งที่ซับซ้อนได้
ประสิทธิภาพสำหรับการเรียนรู้เชิงลึก/การเรียนรู้ของเครื่อง: CPU มีความหลากหลาย แต่ไม่ใช่ตัวเลือกที่ดีที่สุดสำหรับงานการเรียนรู้เชิงลึกและการเรียนรู้ของเครื่องที่เกี่ยวข้องกับการคำนวณเมทริกซ์ที่ครอบคลุม..
คำถามในหัวข้อ 'gpu'
ใช้ ColorMatrix โดยใช้ GPU
ฉันมีแอปพลิเคชัน C# ที่เปลี่ยนสีรูปภาพโดยใช้ ColorMatrix ฉันเข้าใจว่า ColorMatrix ไม่ได้ใช้ GPU วิธีใดคือวิธีที่ดีที่สุดในการสำรวจหากฉันต้องการใช้ GPU เพื่อเปลี่ยนสีรูปภาพ ตัวชี้ว่าควรดูห้องสมุดที่แนะนำที่ไหน ตัวอย่างที่มากกว่านั้น!
564 มุมมอง
schedule
08.01.2024
การลด OpenCL จากส่วนตัวไปสู่ระดับท้องถิ่นและระดับโลก?
เคอร์เนลต่อไปนี้คำนวณสนามความดันเสียง โดยแต่ละเธรดจะคำนวณเป็นอินสแตนซ์ส่วนตัวของเวกเตอร์ pressure ซึ่งจะต้องถูกสรุปลงในหน่วยความจำส่วนกลาง ฉันค่อนข้างแน่ใจว่าโค้ดที่คำนวณ pressure vector นั้นถูกต้อง...
518 มุมมอง
schedule
05.12.2023
อาร์เรย์ OpenCL 2-D คูณ
ฉันเพิ่งเริ่มทดลองกับ OpenCL ฉันกำลังพยายามสร้างเคอร์เนลซึ่งจะคูณอาร์เรย์ 2 มิติสองตัว ฉันได้ทำสิ่งนี้กับเวกเตอร์ไปแล้ว แต่ใน 2 วัน ฉันจะได้ผลลัพธ์จากแถวแรกเท่านั้น ฉันได้ลองใช้วิธีแก้ปัญหาบางอย่างที่ฉันพบแล้ว...
1561 มุมมอง
schedule
17.01.2024
สร้างเคอร์เนล AMD OpenCL โดยใช้รหัส Assembly
ฉันต้องการสร้างเคอร์เนล OpenCL ที่ทำงานบน AMD GPU (Fury Nano) โดยพื้นฐานแล้วฉันต้องการเขียนเคอร์เนลแบบร่างโดยใช้ OpenCL และใช้ OpenCL API เพื่อส่งออกโค้ดแอสเซมบลีโดยใช้ clGetProgramInfo จากนั้นผมจะแก้ไขโค้ดแอสเซมบลีและโหลดกลับเข้าสู่โปรแกรมโดยใช้...
919 มุมมอง
schedule
30.12.2023
ปัญหาเกี่ยวกับการติดตั้งน้ำลึก (H2O) ในอาร์
ฉันประสบปัญหาในการทำให้ DeepWater และทำงานใน R ผ่านทาง H2O ฉันดาวน์โหลดไฟล์ .jar ล่าสุดแล้ว (ฉันคิดว่า) แต่ฉันได้รับข้อผิดพลาดต่อไปนี้คำสั่งการติดตั้งนี้:
install.packages("C:\\Users\\..\\Documents\\R\\win-
library\\3.4\\h2o_3.10.3.99999.tar.gz",...
292 มุมมอง
schedule
30.12.2023
การเรียกใช้กระบวนการเทนเซอร์โฟลว์หลายกระบวนการบน GPU เดียวกันไม่ปลอดภัยหรือไม่
ฉันมี GPU เพียงตัวเดียว (Titan X Pascal, 12 GB VRAM) และฉันต้องการฝึกหลายรุ่นพร้อมกันบน GPU ตัวเดียวกัน
ฉันพยายามห่อหุ้มโมเดลของฉันในโปรแกรมหลามตัวเดียว (เรียกว่า model.py) และฉันรวมโค้ดใน model.py เพื่อจำกัดการใช้งาน VRAM (ตาม ตัวอย่างนี้ )...
6602 มุมมอง
schedule
03.12.2023
dot product พร้อม PyCUDA และหน่วยความจำที่ปักหมุด
ขณะนี้ฉันกำลังทำงานกับดอทโปรดัคที่มีหน่วยความจำที่ปักหมุดไว้โดยใช้ PyCUDA และฉันมีปัญหากับอาร์เรย์ขนาดใหญ่
ฉันทำงานกับ:
NVIDIA GTX1060
CUDA 9.1
PyCUDA 2017.1.1
รหัสคือ:
#!/usr/bin/env python
import numpy as np
import argparse...
865 มุมมอง
schedule
29.12.2023
ฉันจะเริ่มงานฝึกอบรม AWS Sagemaker ด้วยการเข้าถึง GPU ในคอนเทนเนอร์นักเทียบท่าของฉันได้อย่างไร
ฉันมีโค้ดหลามที่ฝึกโครงข่ายประสาทเทียมโดยใช้เทนเซอร์โฟลว์
ฉันได้สร้างอิมเมจนักเทียบท่าตามอิมเมจ tensorflow/tensorflow:latest-gpu-py3 ที่รันสคริปต์ python ของฉัน เมื่อฉันเริ่มอินสแตนซ์ EC2 p2.xlarge ฉันสามารถรันคอนเทนเนอร์นักเทียบท่าได้โดยใช้คำสั่ง...
1411 มุมมอง
schedule
03.11.2023
PyTorch: ขณะโหลดข้อมูลแบบแบตช์โดยใช้ Dataloader วิธีถ่ายโอนข้อมูลไปยัง GPU โดยอัตโนมัติ
หากเราใช้คลาส Dataset และ Dataloader รวมกัน (ดังที่แสดงด้านล่าง) ฉันจะต้องโหลดข้อมูลลงใน GPU อย่างชัดเจนโดยใช้ .to() หรือ .cuda() มีวิธีสั่งให้ dataloader ทำโดยอัตโนมัติ/โดยปริยายหรือไม่?
รหัสเพื่อทำความเข้าใจ/สร้างสถานการณ์จำลอง:
from...
545 มุมมอง
schedule
28.10.2023
ฝึกโมเดล Shakespeare ด้วย GPU แทน TPU
ฉันกำลังพยายามดูความแตกต่างระหว่างการฝึกโมเดลด้วย TPU และ GPU
นี่คือส่วนของรูปแบบการฝึกอบรม:
import time
start = time.time()
tf.keras.backend.clear_session()
resolver = tf.distribute.cluster_resolver.TPUClusterResolver(tpu='grpc://' +...
40 มุมมอง
schedule
27.12.2023