Tensoflow error: Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED

Question

My computer specification are: Windows 10 cuda 11.2 cudnn 8.0.5 Nvidia geforce GTX 3080

I used this web(https://github.com/armaanpriyadarshan/Training-a-Custom-TensorFlow-2.x-Object-Detector) to install faster rcnn. When I trained this network, it had an error:

2021-01-24 18:12:47.713443: E tensorflow/stream_executor/cuda/cuda_dnn.cc:336] Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2021-01-24 18:12:47.715010: E tensorflow/stream_executor/cuda/cuda_dnn.cc:340] Error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows
2021-01-24 18:12:47.718097: E tensorflow/stream_executor/cuda/cuda_dnn.cc:336] Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2021-01-24 18:12:47.719553: E tensorflow/stream_executor/cuda/cuda_dnn.cc:340] Error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows
Traceback (most recent call last):
  File "model_main_tf2.py", line 113, in 
    tf.compat.v1.app.run()
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\platform\app.py", line 40, in run
    _run(main=main, argv=argv, flags_parser=_parse_flags_tolerate_undef)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages\absl\app.py", line 300, in run
    _run_main(main, args)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages\absl\app.py", line 251, in _run_main
    sys.exit(main(argv))
  File "model_main_tf2.py", line 104, in main
    model_lib_v2.train_loop(
  File "C:\Anaconda\envs	ensorflow\lib\site-packages\object_detection\model_lib_v2.py", line 561, in train_loop
    load_fine_tune_checkpoint(detection_model,
  File "C:\Anaconda\envs	ensorflow\lib\site-packages\object_detection\model_lib_v2.py", line 361, in load_fine_tune_checkpoint
    strategy.run(
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\distribute\distribute_lib.py", line 1259, in run
    return self._extended.call_for_each_replica(fn, args=args, kwargs=kwargs)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\distribute\distribute_lib.py", line 2730, in call_for_each_replica
    return self._call_for_each_replica(fn, args, kwargs)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\distribute\mirrored_strategy.py", line 628, in _call_for_each_replica
    return mirrored_run.call_for_each_replica(
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\distribute\mirrored_run.py", line 75, in call_for_each_replica
    return wrapped(args, kwargs)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\eager\def_function.py", line 828, in __call__
    result = self._call(*args, **kwds)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\eager\def_function.py", line 888, in _call
    return self._stateless_fn(*args, **kwds)
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\eager\function.py", line 2942, in __call__
    return graph_function._call_flat(
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\eager\function.py", line 1918, in _call_flat
    return self._build_call_outputs(self._inference_function.call(
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\eager\function.py", line 555, in call
    outputs = execute.execute(
  File "C:\Anaconda\envs	ensorflow\lib\site-packages	ensorflow\python\eager\execute.py", line 59, in quick_execute
    tensors = pywrap_tfe.TFE_Py_Execute(ctx._handle, device_name, op_name,
tensorflow.python.framework.errors_impl.UnknownError: 2 root error(s) found.
  (0) Unknown:  Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
         [[node model/conv1_conv/Conv2D (defined at \site-packages\object_detection\meta_architectures\faster_rcnn_meta_arch.py:1346) ]]
         [[Loss/RPNLoss/BalancedPositiveNegativeSampler/Cast_8/_192]]
  (1) Unknown:  Failed to get convolution algorithm. This is probably because cuDNN failed to initialize, so try looking to see if a warning log message was printed above.
         [[node model/conv1_conv/Conv2D (defined at \site-packages\object_detection\meta_architectures\faster_rcnn_meta_arch.py:1346) ]]
0 successful operations.
0 derived errors ignored. [Op:__inference__dummy_computation_fn_16411]

Errors may have originated from an input operation.
Input Source operations connected to node model/conv1_conv/Conv2D:
 model/lambda/Pad (defined at \site-packages\object_detection\models\keras_models
esnet_v1.py:49)

Input Source operations connected to node model/conv1_conv/Conv2D:
 model/lambda/Pad (defined at \site-packages\object_detection\models\keras_models
esnet_v1.py:49)

Function call stack:
_dummy_computation_fn -> _dummy_computation_fn

How to solve this problem?

Tensoflow error: Could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED

Answers (1)

Related Questions