สิ่งตีพิมพ์ในหัวข้อ 'gpu'


Cellular Automata บน GPU พร้อม Julia (พื้นฐาน)
ต้นฉบับ https://blog.devel.faith/posts/celular-automata-on-gpu-julia/ ในโพสต์นี้ เราจะเรียนรู้เกี่ยวกับการเขียนโปรแกรม GPU ขั้นพื้นฐานและ Julia โดยการเขียนโค้ด Game of Life ของ Conway คุณอาจต้องการลองค้นหา "Conway's Game of Life" บน Google ;) ชีวิตคืออะไร? เวอร์ชั่น Tl;dr สำหรับการวนซ้ำแต่ละครั้ง ประชากรน้อย: เซลล์ใดๆ ที่มีเพื่อนบ้านน้อยกว่า 2 คนจะตาย การมีประชากรมากเกินไป: เซลล์ใดๆ ที่มีเพื่อนบ้านมากกว่า 3 คนจะตาย การสืบพันธุ์: เซลล์ใดๆ ที่มีเพื่อนบ้าน 3 ตัวจะมีชีวิตอยู่..

คู่มือที่ครอบคลุมเกี่ยวกับ CPU, GPU และ TPU สำหรับการเรียนรู้เชิงลึก
ซีพียู (หน่วยประมวลผลกลาง): CPU คือโปรเซสเซอร์อเนกประสงค์ที่พบในคอมพิวเตอร์ส่วนใหญ่ ได้รับการออกแบบมาเพื่องานที่หลากหลายและเป็นเลิศในการประมวลผลตามลำดับ CPU มีคอร์ที่ทรงพลังเพียงไม่กี่คอร์ที่สามารถจัดการกับคำสั่งที่ซับซ้อนได้ ประสิทธิภาพสำหรับการเรียนรู้เชิงลึก/การเรียนรู้ของเครื่อง: CPU มีความหลากหลาย แต่ไม่ใช่ตัวเลือกที่ดีที่สุดสำหรับงานการเรียนรู้เชิงลึกและการเรียนรู้ของเครื่องที่เกี่ยวข้องกับการคำนวณเมทริกซ์ที่ครอบคลุม..

คำถามในหัวข้อ 'gpu'

ใช้ ColorMatrix โดยใช้ GPU
ฉันมีแอปพลิเคชัน C# ที่เปลี่ยนสีรูปภาพโดยใช้ ColorMatrix ฉันเข้าใจว่า ColorMatrix ไม่ได้ใช้ GPU วิธีใดคือวิธีที่ดีที่สุดในการสำรวจหากฉันต้องการใช้ GPU เพื่อเปลี่ยนสีรูปภาพ ตัวชี้ว่าควรดูห้องสมุดที่แนะนำที่ไหน ตัวอย่างที่มากกว่านั้น!
564 มุมมอง
schedule 08.01.2024

การลด OpenCL จากส่วนตัวไปสู่ระดับท้องถิ่นและระดับโลก?
เคอร์เนลต่อไปนี้คำนวณสนามความดันเสียง โดยแต่ละเธรดจะคำนวณเป็นอินสแตนซ์ส่วนตัวของเวกเตอร์ pressure ซึ่งจะต้องถูกสรุปลงในหน่วยความจำส่วนกลาง ฉันค่อนข้างแน่ใจว่าโค้ดที่คำนวณ pressure vector นั้นถูกต้อง...
518 มุมมอง
schedule 05.12.2023

อาร์เรย์ OpenCL 2-D คูณ
ฉันเพิ่งเริ่มทดลองกับ OpenCL ฉันกำลังพยายามสร้างเคอร์เนลซึ่งจะคูณอาร์เรย์ 2 มิติสองตัว ฉันได้ทำสิ่งนี้กับเวกเตอร์ไปแล้ว แต่ใน 2 วัน ฉันจะได้ผลลัพธ์จากแถวแรกเท่านั้น ฉันได้ลองใช้วิธีแก้ปัญหาบางอย่างที่ฉันพบแล้ว...
1561 มุมมอง
schedule 17.01.2024

สร้างเคอร์เนล AMD OpenCL โดยใช้รหัส Assembly
ฉันต้องการสร้างเคอร์เนล OpenCL ที่ทำงานบน AMD GPU (Fury Nano) โดยพื้นฐานแล้วฉันต้องการเขียนเคอร์เนลแบบร่างโดยใช้ OpenCL และใช้ OpenCL API เพื่อส่งออกโค้ดแอสเซมบลีโดยใช้ clGetProgramInfo จากนั้นผมจะแก้ไขโค้ดแอสเซมบลีและโหลดกลับเข้าสู่โปรแกรมโดยใช้...
919 มุมมอง
schedule 30.12.2023

ปัญหาเกี่ยวกับการติดตั้งน้ำลึก (H2O) ในอาร์
ฉันประสบปัญหาในการทำให้ DeepWater และทำงานใน R ผ่านทาง H2O ฉันดาวน์โหลดไฟล์ .jar ล่าสุดแล้ว (ฉันคิดว่า) แต่ฉันได้รับข้อผิดพลาดต่อไปนี้คำสั่งการติดตั้งนี้: install.packages("C:\\Users\\..\\Documents\\R\\win- library\\3.4\\h2o_3.10.3.99999.tar.gz",...
292 มุมมอง
schedule 30.12.2023

การเรียกใช้กระบวนการเทนเซอร์โฟลว์หลายกระบวนการบน GPU เดียวกันไม่ปลอดภัยหรือไม่
ฉันมี GPU เพียงตัวเดียว (Titan X Pascal, 12 GB VRAM) และฉันต้องการฝึกหลายรุ่นพร้อมกันบน GPU ตัวเดียวกัน ฉันพยายามห่อหุ้มโมเดลของฉันในโปรแกรมหลามตัวเดียว (เรียกว่า model.py) และฉันรวมโค้ดใน model.py เพื่อจำกัดการใช้งาน VRAM (ตาม ตัวอย่างนี้ )...
6602 มุมมอง
schedule 03.12.2023

dot product พร้อม PyCUDA และหน่วยความจำที่ปักหมุด
ขณะนี้ฉันกำลังทำงานกับดอทโปรดัคที่มีหน่วยความจำที่ปักหมุดไว้โดยใช้ PyCUDA และฉันมีปัญหากับอาร์เรย์ขนาดใหญ่ ฉันทำงานกับ: NVIDIA GTX1060 CUDA 9.1 PyCUDA 2017.1.1 รหัสคือ: #!/usr/bin/env python import numpy as np import argparse...
865 มุมมอง

ฉันจะเริ่มงานฝึกอบรม AWS Sagemaker ด้วยการเข้าถึง GPU ในคอนเทนเนอร์นักเทียบท่าของฉันได้อย่างไร
ฉันมีโค้ดหลามที่ฝึกโครงข่ายประสาทเทียมโดยใช้เทนเซอร์โฟลว์ ฉันได้สร้างอิมเมจนักเทียบท่าตามอิมเมจ tensorflow/tensorflow:latest-gpu-py3 ที่รันสคริปต์ python ของฉัน เมื่อฉันเริ่มอินสแตนซ์ EC2 p2.xlarge ฉันสามารถรันคอนเทนเนอร์นักเทียบท่าได้โดยใช้คำสั่ง...
1411 มุมมอง

PyTorch: ขณะโหลดข้อมูลแบบแบตช์โดยใช้ Dataloader วิธีถ่ายโอนข้อมูลไปยัง GPU โดยอัตโนมัติ
หากเราใช้คลาส Dataset และ Dataloader รวมกัน (ดังที่แสดงด้านล่าง) ฉันจะต้องโหลดข้อมูลลงใน GPU อย่างชัดเจนโดยใช้ .to() หรือ .cuda() มีวิธีสั่งให้ dataloader ทำโดยอัตโนมัติ/โดยปริยายหรือไม่? รหัสเพื่อทำความเข้าใจ/สร้างสถานการณ์จำลอง: from...
545 มุมมอง

ฝึกโมเดล Shakespeare ด้วย GPU แทน TPU
ฉันกำลังพยายามดูความแตกต่างระหว่างการฝึกโมเดลด้วย TPU และ GPU นี่คือส่วนของรูปแบบการฝึกอบรม: import time start = time.time() tf.keras.backend.clear_session() resolver = tf.distribute.cluster_resolver.TPUClusterResolver(tpu='grpc://' +...
40 มุมมอง