Learning/Python

Tensorflow - InternalError

usefuLake 2020. 8. 7. 19:58

InternalError: Blas GEMM launch failed : a.shape=(10, 50), b.shape=(50, 200), m=10, n=200, k=50 [[{{node lstm_1/while/body/_1/MatMul_1}}]] [Op:__inference_keras_scratch_graph_2573]

 

https://stackoverflow.com/questions/37337728/tensorflow-internalerror-blas-sgemm-launch-failed

 

TensorFlow: InternalError: Blas SGEMM launch failed

When I run sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys}) I get InternalError: Blas SGEMM launch failed. Here is the full error and stack trace: InternalErrorTraceback (most recent call

stackoverflow.com

 

원인

여러개의 Tensorflow Process가 GPU resources를 사용하려할 때 발생

- 하나의 Tensorflow Process가 GPU memory를 사용하고 있을 때, 다른 Tensor가 GPU memory를 사용하려고 하면 Error 발생

 

해결책

여러가지 해결책이 있었으나, 우선 내가 쓰던 jupyter python 환경 kernel 재실행

- 다 끄고 다시 kernel 재실행하고 해보았으나 다시 되진 않았음

 

결국 만능해결사 재부팅 실행

- 정확한 원인을 찾지 못했으나, 일단 training은 문제없이 돌아감

 

'Learning > Python' 카테고리의 다른 글

VSC Jupyter notebook Kernel Error  (0) 2023.07.20