Publikasi tentang topik tersebut 'cuda'


Dari awal hingga instalasi CUDA dan kompilasi TensorFlow dari sumber di Ubuntu 20.04
Selalu frustrasi kehilangan banyak waktu saat menerapkan berbagai tutorial online tentang cara menginstal driver Nvidia, CUDA, cuDNN, atau cara mengkompilasi sumber TensorFlow dengan dukungan GPU yang menyebabkan kegagalan fungsi atau kesalahan kompilasi. Saya sendiri, saya kehilangan waktu berhari-hari untuk mencoba menginstal alat dan perpustakaan ini dengan benar meskipun tutorial resminya tidak berfungsi. Di sini, saya ingin berbagi dengan komunitas pembelajaran mesin dan komputasi..

Pertanyaan tentang topik tersebut 'cuda'

Konsistensi penunjuk fungsi Cuda [duplikat]
Saya baru-baru ini mencoba menggunakan penunjuk fungsi untuk secara dinamis menentukan beberapa tahap pemrosesan dalam aplikasi saya, yang berjalan pada sm_30. Akan sulit untuk memposting kode di sini, karena ada banyak file dan fungsi berbeda yang...
480 dilihat
schedule 29.12.2023

Penyalinan array lebih cepat saat menggunakan lebih sedikit thread di CUDA
Saya menguji dua pendekatan berbeda untuk menyalin array 2D di kernel CUDA. Yang pertama meluncurkan blok thread TILE_DIM x TILE_DIM. Setiap blok menyalin petak array yang menetapkan satu thread per elemen: __global__ void simple_copy(float...
1487 dilihat
schedule 15.01.2024

Apakah mungkin untuk mengakses GPU-RAM dari CPU-Cores dengan penunjuk sederhana di CUDA6 baru?
Sekarang, jika saya menggunakan kode ini untuk mencoba akses ke GPU-RAM dari CPU-Cores dengan menggunakan CUDA5.5 di GeForce GTX460SE (CC2.1), maka saya mendapatkan pengecualian "Pelanggaran Akses": #include "cuda_runtime.h" #include...
3000 dilihat
schedule 15.12.2023

Bagaimana menjelaskan percepatan super-linear yang diamati pada perangkat GPU dengan kode CUDA?
Saya kesulitan memahami kinerja penskalaan komputasi paralel yang memalukan pada Tesla C1060. Menjalankannya menggunakan semua blok dan beberapa utas per blok, saya mendapatkan waktu proses sekitar 0,87 detik. Namun, jika saya menjalankan semua...
385 dilihat
schedule 08.11.2023

CUDA Thrust pengurangan_by_key menggunakan lebih sedikit memori
Saya mencoba mengurangi memori yang diperlukan untuk menghitung pengurangan_by_key untuk kasus penggunaan saya. Saya memiliki jumlah kunci unik yang relatif kecil (sekitar 100-150) dibandingkan dengan jumlah nilai (sekitar 16 juta). contoh kunci...
403 dilihat
schedule 24.10.2023

peringatan: anotasi __host__ pada fungsi default diabaikan ‹- mengapa?
Beralih dari CUDA 8.0 ke CUDA 9.0 RC, saya mendapat peringatan tentang: __host__ __device__ ~Foo() = default; Peringatannya adalah: path/to/Foo.cuh(69): warning: __host__ annotation on a defaulted function("~Foo") is ignored yang...
1535 dilihat
schedule 30.11.2023

Streaming data ke kernel CUDA tanpa banyak peluncuran
Saya mencoba mempercepat algoritma GPU di mana saya menerima aliran partikel asinkron dalam ruang 3D $p=[x,y,t]$. Setiap vektor $p_n$ perlu dikalikan dengan sekumpulan matriks transformasi. Karena transformasi ini tidak bergantung satu sama lain,...
267 dilihat
schedule 05.11.2023

produk titik dengan PyCUDA dan memori yang disematkan
Saat ini saya sedang mengerjakan produk titik dengan memori yang disematkan menggunakan PyCUDA. Dan saya punya masalah dengan array besar. Saya bekerja dengan: NVIDIA GTX 1060 CUDA 9.1 PyCUDA 2017.1.1 Kodenya adalah:...
865 dilihat

Cuda CMake 3.10 CMakeLists.txt
Saya memiliki proyek visual c++ yang membuat dll. Untuk proyek ini saya memiliki CMakeLists.txt yang berfungsi. Sekarang saya membuat dua file sumber cuda yang menyelesaikan proyek dan dengan visual studio build berfungsi dengan baik. Saya ingin...
4426 dilihat
schedule 03.11.2023

pynvrtc di Google Colab: libnvrtc.so tidak ditemukan
Di notebook Google Colab, saya memasang paket python yang menggunakan pynvrtc untuk mengkompilasi beberapa kode CUDA. Saya mendapat kesalahan: OSError: libnvrtc.so: cannot open shared object file: No such file or directory Saya menjalankan...
2769 dilihat
schedule 13.01.2024

Transformasi invers CuFFT 2D salah dibandingkan dengan fftw3 [ditutup]
Saya mencoba menghasilkan beberapa matematika FFT, khususnya melakukan dua transformasi maju 2D, mengalikannya, dan kemudian membuat transformasi terbalik. Sebelum transformasi terbalik semuanya berjalan baik. Saya sudah melakukannya pada fftw3,...
113 dilihat
schedule 06.11.2023

Penguncian Numba Cuda tidak berakhir
Saya mencoba membuat tumpukan thread-safe sederhana di numba cuda, tetapi ketika saya mencoba menggunakan tumpukan, kodenya hang (mungkin dari loop while selama penguncian). Menjalankannya dengan satu utas berfungsi dengan baik dan mutex disetel...
42 dilihat
schedule 21.01.2024