성적인 내용이 '본 글'혹은 '링크'를 통해 포함될 수 있음을 미리 알려드립니다.
이어지는 글입니다. 이전글부터 차근차근 따라해주세요.
이어지는 글입니다. 이전글부터 차근차근 따라해주세요.
추출기능은 Extract 메뉴로 실행합니다.
실행을 누르면 일시적으로 컴퓨터가 매우 느려지고 진행이 되기 시작하면 렉이 풀립니다. 720p(1280x720)를 넘는 그림으로 실행하는 경우 error가 발생하며 실행이 완료된 cmd창은 종료하셔도 됩니다.
주의사항: 얼굴 추출이 완료된 후에 이미지 위치가 저장되는 json파일이 생성됩니다. 게시글에 올린방법대로 비디오 파일을 캡쳐하여 이미지를 생성하는 경우 문제가 없지만, 따로저장한 이미지를 사용하시는 경우 grey 머시기 에러가 나타나서 중간에 멈출 수 있으며 이에따라 *.json 파일이 만들어지지 않아 처음부터 추출을 다시해야할 우려가 있습니다.
따라서 많은 양의 이미지, 다른 방법으로 수집한 이미지 파일을 한번에 작업하신다면 다음 글을 참고하여 나누어서 작업하시는 요령이 필요하겠습니다.
링크 - 기존 얼굴 추출 파일에 새로 추출한 얼굴 추가하기 aligned
추출한 얼굴사진중 junk data들을 지워주셔야 합니다.
- PathsData: 얼굴 추출을 하기위한 이미지가 들어있는 폴더의 경로입니다. 이번 경우에는 총 2번을 실행합니다. 각 실행에서 C:/fakes/data_A, C:/fakes/data_B를 입력합니다. 또한 폴더내에는 다른 파일이 있으면 안됩니다.
- File Type: 이미지파일의 확장자입니다. 이미지파일의 확장자는 jpg 혹은 png하나여야 합니다.
- Mult Faces: 여러사람의 얼굴이 있는경우는 값을 true로 작성해주세요.
- First, LAst Frame: Auto로 두시면 됩니다.
- Model Processor: GPU로 하시면 됩니다. CPU는 시간이 매우 오래 걸리는 것으로 알고 있습니다.
실행하면 그림과 같은 진행사항을 볼 수 있습니다. |
주의사항: 얼굴 추출이 완료된 후에 이미지 위치가 저장되는 json파일이 생성됩니다. 게시글에 올린방법대로 비디오 파일을 캡쳐하여 이미지를 생성하는 경우 문제가 없지만, 따로저장한 이미지를 사용하시는 경우 grey 머시기 에러가 나타나서 중간에 멈출 수 있으며 이에따라 *.json 파일이 만들어지지 않아 처음부터 추출을 다시해야할 우려가 있습니다.
따라서 많은 양의 이미지, 다른 방법으로 수집한 이미지 파일을 한번에 작업하신다면 다음 글을 참고하여 나누어서 작업하시는 요령이 필요하겠습니다.
링크 - 기존 얼굴 추출 파일에 새로 추출한 얼굴 추가하기 aligned
얼굴 추출 예시1 |
얼굴 추출 예시2 |
- 내가 원하지 않는 사람의 얼굴
- 댄서의 얼굴사진이 아닌 본인의 얼굴사진중 머리카락, 손, 마이크, 선글라스등으로 얼굴을 가린 사진
- 이상하게 회전되있는 사진
러닝을 위해 Train 메뉴를 클릭해주세요
Paths에 해당하는 것들은 모두 직접 타이핑하여 재입력해주세요.
- Model: C:/fakes/model
- Data A: C:/fakes/data_A/aligned
- Data B: C:/fakes/data_B/aligned
Options값은 클수록 처리속도가 빨라지지만 실행자체가 되지않는 oom(out of memory) error의 원인이 될 수 있습니다. 다음은 gtx 1060 3gb를 기준으로 작성하였으며 실행이 되는 범위에서 크기를 조절하시면 됩니다.
(옵션값의 적절한 값을 찾으면 댓글로 안내해주세요.)
- Batch Size: 32
- Save Period: 32
- Processor: GPU
- Layers: 4
- Nodes: 256 (이 항목또한 oom error의 원인이 될 수 있어 낮췄음)
- Mem Ratio: defalut
- GPU Growth: false
|
|
이제 Start를 누르면 cmd 창이 뜨면서 실행이 됩니다(원활한 실행 및 속도향상을 위해 가급적 다른 프로그램들은 종료해주세요). 이때 프로그램 자체의 버그로 새로 실행된 cmd창의 제목을 확인해주셔야 합니다(제목이 너무 길어 안보이면 아래 시작줄에 마우스를 올려 확인할 수 있음). 시간이 조금 지나면 그냥 cmd.exe로 이름이 변경되는 부분 유의해주세요.
이름을 잘 보시면 이전에 입력한 정보들이 나열되있는 것을 확인할 수 있습니다. ex: C:/fakes/model C:/fakes/data_A... 그런데 에러가 발생하는 경우 encoder.h5와 같은 다른 경로가 나타난것을 볼 수 있습니다. 이때는 cmd창을 종료하고 경로(Path)를 재입력한후 실행해 주세요. (실행시에 저장장치에 5gb이상의 충분한 여유공간이 필요합니다.)
train을 실행한 경우 C:\Users\[사용자이름]\AppData\Temp 경로에 _MEI등으로 시작하는 찌거기 파일들이 남아있어 공간을 차지할 수 있으니 이미 끝난 작업, 중단된 작업에 해당하는 파일들을 삭제해주세요 중간에 별다른걸 안하셨으면 수정한 날짜를 보고 신중하게 삭제해주시면 됩니다.
Cmd로 확인 Loss 값 확인 |
정상적으로 진행이 되면 그림과 같이 학습창이 나타납니다. 왼쪽 절반은 A의 얼굴이 B로 변하고, 오른쪽 절반은 B의 얼굴이 A로 변하는 것을 확인할 수 있습니다. (진행이 거의 완료된 예시: https://i.imgur.com/hpyVyBS.png)
cmd창에는 Loss: 0.0123211 0.0122512등의 숫자가 나타납니다. 시간이 지나감에 따라 숫자는 0에 가까워집니다. 작을수록 품질이 좋다고 볼 수 있으며 충분히 결과가 좋다고 판단되면 'q'를 눌러 작업을 종료하면 됩니다.(참고로 q는 이미지트레이닝창에서 해야함?, q로 저장되고 종료되는데에 시간이 꽤 오래걸림)
다음에는 작성한 파일을 바탕으로 최종 결과물을 생성해보겠습니다.
다음에는 작성한 파일을 바탕으로 최종 결과물을 생성해보겠습니다.
잘보고 그대로 따라해보고 있습니다. 그런데 fakeapp.bat 실행 후 Extract로 결로 설정하고 start로 실행시 새로운 cmd 창이 뜨면서 에러가 발생하네요 영상파일도 720p 해상도 아래것으로 했는데도 그러고 뭐가 문제일까요?
답글삭제나타나도 상관없는 에러가 원래 하나뜰 수 있습니다. 다만 어떤 에러인지 내용을 적어주시면 도움을 드릴 수 있을 것 같네요.
삭제C:/FakeApp/alignment/a.exe'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
삭제배치 파일이 아닙니다.
라고 뜹니다 같은 오류 겪고 있습니다
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[9428] Failed to execute script align_faces
CUDA 8.0버전으로 설치하셨나요?
삭제네 8.0으로 설치 했구요 다만 2장에서 일러주신대로 고급설치에서 다른것들은 빼고 쿠다만 체크하고 설치했어요
삭제train 해서 좋은 결과물 나오는데 몇일 걸리셨나용?
답글삭제시간부족으로 아직 좋은 결과물을 얻은 적이없네요ㅜㅜ. 하지만 다른 글들을 참고하여 말씀드리면 하루이상걸립니다. 다만 시간을 충분히 투자하더라도 충분한 이미지 데이터에 기반했을 때 좋은 결과를 얻을 수 있습니다.(다양한 각도나 조명상황에서 500~1000장)
삭제RuntimeError: Error while calling cudaOccupancyMaxPotentialBlockSize(&num_blocks,&num_threads,K) in file c:\arthur\dlib-master\dlib\dnn\cuda_utils.h:155. code: 8, reason: invalid device function
답글삭제첫번째 과정에서 이렇게 뜨면서 안되는데 이게 무슨 뜻이죠?
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제0%| | 0/1448 [00:00
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaOccupancyMaxPotentialBlockSize(&num_blocks,&num_threads,K) in file c:\arthur\dlib-master\dlib\dnn\cuda_utils.h:155. code: 8, reason: invalid device function
[1688] Failed to execute script align_faces
라고 뜨네요 ㅠㅠ
찾아보니까 파이썬 ? 넘피? 이거 깔려있어야 되는거 같은데요? 뭐죠....
답글삭제CUDA 8.0 버전 올바르게 설치하시고 환경변수 추가하셨나요?
삭제하셨는데도 안된다면 https://developer.nvidia.com/cuda-gpus 들어가셔서
CUDA-Enabled Geforce Products클릭하신 후 사용하시는 GPU의 compute Capability가 2.0 이상인지 확인해 보세요
말씀하신거 다 확인했는데 맞습니다..
삭제RuntimeError: Error while calling cudaOccupancyMaxPotentialBlockSize(&num_blocks,&num_threads,K) in file c:\arthur\dlib-master\dlib\dnn\cuda_utils.h:155. code: 8, reason: invalid device function
[604] Failed to execute script align_faces
이거만 무슨말인지 알면 해결 될거 같은데 아시나요? ㅠ
아 여러군데 찾아보니 그래픽 카드가 안좋으면 저럴 수 있는거 같은데... 제가 gtx640쓰거든요? 문제가 이거였나요 혹시 ㅠㅠ
삭제640이 아니라 630이네요. 2.1 입니다! 어떤가요? dsdiag 확인해보니
삭제전체 메모리 근사값 4017
디스플레이 메모리 1999
공유메모리 2017 입니다
안깔려있어도됩니다.
답글삭제0.01 이하로는 안내려가나요?
답글삭제내려갑니다. 내려가도 가지고 계신 이미지 데이터 양, 품질에 따라 여전히 결과가 안좋을 수 있으니, 결과는 프리뷰 화면을 통해 눈으로 확인하심이 좋을듯 합니다.
삭제작성자가 댓글을 삭제했습니다.
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제0%| | 0/2808 [00:00
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaMalloc(&data, n) in file C:\Arthur\dlib-master\dlib\dnn\cuda_data_ptr.cpp:28. code: 2, reason: out of memory
[15420] Failed to execute script align_faces
C:\Users\Movement\Downloads\FakeApp>
라는 오류가 납니다. 현재 사용중인 그래픽카드는 gtx960이고, 환경변수, cuda는 설치되었습니다.
어떻게 해결 할 수 있나요??
해결했습니다~
삭제작성자가 댓글을 삭제했습니다.
삭제어떻게 해결하셨나요?
삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제0%| | 0/300 [00:00
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaMalloc(&data, n) in file C:\Arthur\dlib-master\dlib\dnn\cuda_data_ptr.cpp:28. code: 2, reason: out of memory
[11196] Failed to execute script align_faces
계속 이렇게 오류가 납니다..
죄송합니다
삭제주의사항에 "720p(1280x720)를 넘는 그림으로 실행하는 경우 error가 발생" 을 유심히 보지 못했네요
감사합니다
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제0%| | 0/171 [00:00
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaMalloc(&data, new_size*sizeof(float)) in file C:\Arthur\dlib-master\dlib\dnn\gpu_data.cpp:195. code: 2, reason: out of memory
[7492] Failed to execute script align_faces
위같은 오류가 뜨는데 어떻게 해결해야 하나요?
윗분이랑 같은 오류네요. 이미지 크기(해상도) 확인해주세요. 그래도 나타나면 꿀뷰등을 이용해서 이미지 파일 jpg로 변환하여 용량자체를 낮춰주세요.
삭제강좌보고 열심히 따라왔습니다.
답글삭제근데 train에서 막힙니다..
start를 누르면 새로운 창이 뜨고
https://www.dropbox.com/s/g1lwh3ji9m84ehd/1.png?dl=0
이와 같은 도스 창이 뜹니다.
그 후 q를 누르면
https://www.dropbox.com/s/fcks8qf7vvwijm1/2.png?dl=0
https://www.dropbox.com/s/8puzx516i5zeqj9/3.png?dl=0
https://www.dropbox.com/s/tffjaqabslvkcyn/4.png?dl=0
이러한 작업들이 진행이 되며 실패합니다.
오류문구중에 oom when ~ tensor with shape 라는게 보여서 레딧에서 찾아보니
그 옵션 사이즈를 작게하라고 나와있어서 batch size와 save period는 8을 주고
nodes는 64의 값을 주었는데도 마찬가지입니다.
레딧에서 댓글을 보니까 gtx960 2gb는 안된다는거같기도한데.. 이 그래픽 카드로는 안되는건가요?
저는 gtx670 2g로 영상까지는 못 보고 인터넷은 큰 랙 없이 멀티테스킹까지 하면서 여유롭게 돌리고있습니다. 레이어를 2, 노드를 16~32 사이로 해보세요.
삭제노드랑 레이어를 잘 설정하면 2gb 보다 낮은 vga로도 되는걸로 알고있습니다.(문제가 많은건 맞습니다.) 프로그램 재실행, 설정 조정하여 해보세요. memratio를 설정하는 방법도 있다고 하는데 이건 불안정해서 지양하라고 하네요.
답글삭제댓글 감사합니다. 어찌어찌하니 오류멘트가 바뀌었네요
삭제assertionError로 잘못된 사이즈라고 256x256사이즈로 해야된다는데..
data_a/aligned 의 사진들 전부 256x256사이즈인데도 이런 오류가 날때는 어떻게 해야되나요?
경로 설정에 해당하는 부분 모두 직접 타이핑하여 재입력후 엔터해주세요, 오타도 확인해 주시구요. 게시글 참고하셔시면 될 듯합니다. 저도 몇번 겪었던거 같은데 이렇게 해서 됐을 겁니다~
삭제저처럼 그래픽카드 후진분들은
삭제batch size, save period 값은 16, layers는 2, nodes 64, mem ratio는 1로 해보세요
경로는 작성자분 말씀대로 재입력 해보시고, 가끔 안될땐 껏다가 다시켜서 실행 할 경우 될때도 있습니다.
Train을 시도해보니 아래와 같은 오류가 나오는데 어떻게 해결할 수 있을런지요? 도움을 좀 부탁드립니다.
답글삭제ValueError : could not broadcast input array from shape (673.600.3) into shape (734.600.3)
[12720] Failed to execute script train
이미지를 게시글 방법대로 비디오에서 캡쳐하신게 맞나요?
삭제C:/fakes 대신에 c:/fakes 같은 방식으로 다시 직접입력하여 실행해보시기 바랍니다.
삭제Extract 과정에서 그대로 하면 cmd창이 하나 더 열리면서
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[3040] Failed to execute script align_faces
C:\FakeApp>
라고 뜨네요 ㅠㅠ
사진크기 이상없어요. 그래픽 카드 이상없고 cuda 제대로 설치 돼 있어요..
https://www.microsoft.com/ko-kr/download/details.aspx?id=48145
삭제링크 들어가서 Visual Studio 2015용 Visual C++ 재배포 가능 패키지 설치하세요.
2015년도보다 더최신버전이 다운되있어서 다운할수가 없다는데 어떻게 해야 할까요?
삭제ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[32,2048,4,4]
답글삭제[[Node: model_1/conv2d_5/convolution = Conv2D[T=DT_FLOAT, data_format="NHWC", padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](model_1/reshape_1/Reshape, conv2d_5/kernel/read)]]
[[Node: loss/mul/_211 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_1601_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
[2620] Failed to execute script train
train 과정에서 이러한 오류가발생합니다.. 올려주신걸 토대로 그대로 했습니다만.
oom(out of memory) 에러입니다. train중 발생하셨으니 노드랑 레이어 숫자 하향 조정하여 다시 해보시기 바랍니다.
삭제사용하고 계신 그래픽카드에 맞는 노드와 레이어 설정을 올려주시면 다른분들에게도 도움이 됩니다.
삭제답변 감사합니다.
삭제세팅을 위에두개 16 16, 레이어 2, 노드 64, ratio1로 하니까 잘 되네요
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제25%|█████████████████████ | 1/4 [00:02<00:06, 2.23s/it]
Traceback (most recent call last):
File "align_faces.py", line 145, in
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Unsupported image type, must be 8bit gray or RGB image.
[10184] Failed to execute script align_faces
저는 이렇게 뜨는데 이미지타입을 바꾸는 방법이 따로 있나요?
저는 동영상내에 얼굴을 제가 따로 저장한 이미지로 바꾸고싶어서(동영상에서 추출하지 않은) 저장한 이미지를 data_B에 넣어놨거든요.. 근데 저렇게 뜨네요..
삭제게시글 방법대로 캡쳐하지 않은 경우 이미지 파일 형식에 따라 이런 오류가 발생하실 수 있습니다. 꿀뷰설치하신후 이미지 파일 우클릭하여 jpg로 변환하여 사용해보세요.
삭제(1280x720 제한 걸어서 변환, 변환 후에도 용량너무 클 경우 화질줄여서 용량 줄이기)
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 145, in
File "align_faces.py", line 92, in main
AssertionError: Can't find input directory C:\fakes\data_B
[10416] Failed to execute script align_faces
C:\FakeApp>
이러고 뜨던데 AB둘다 크기는 720을 넘지는 않습니다...도와주시면 감사하겠습니다
아 제가 파일명을 잘못썩군요 해경됬스비다 감사합니다
삭제작성자가 댓글을 삭제했습니다.
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\Users\ㅎ\Desktop\FakeApp\alignment\torch\__init__.py", line 2, in
import torch.cuda
File "C:\Users\ㅎ\Desktop\FakeApp\alignment\torch\cuda\__init__.py", line 344, in
from .random import *
File "C:\Users\ㅎ\Desktop\FakeApp\alignment\torch\cuda\random.py", line 1, in
from torch import _C
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[3036] Failed to execute script align_faces
환경변수, CUDA, 이미지 크기 모두 했는데 안되네요...ㅠㅠ
작성자가 댓글을 삭제했습니다.
삭제9FF00 of size 18874368
답글삭제2018-01-27 05:45:10.291309: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 0000000541C9FF00 of size 3276800
2018-01-27 05:45:10.291331: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 0000000541FBFF00 of size 13107200
2018-01-27 05:45:10.291353: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 0000000542C3FF00 of size 52428800
2018-01-27 05:45:10.291375: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 0000000545E3FF00 of size 16777216
2018-01-27 05:45:10.291397: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 0000000546E3FF00 of size 16777216
2018-01-27 05:45:10.291419: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 0000000547E3FF00 of size 75497472
2018-01-27 05:45:10.291441: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:661] Chunk at 000000054C63FF00 of size 18874368
ㅓ무 길어서 써지지도 아하서 이어서 보랠려고했는데 그러기에 도배 태러 같아 보일까봐 하지 못하겠네요 ㅠㅠ
삭제Limit: 1550703001
InUse: 1528071168
MaxInUse: 1549819392
NumAllocs: 280
MaxAllocSize: 163404288
2018-01-27 05:45:10.292816: W C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:277] ***************************************************************************************************_
2018-01-27 05:45:10.292846: W C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\framework\op_kernel.cc:1192] Resource exhausted: OOM when allocating tensor with shape[32,256,32,32]
Traceback (most recent call last):
File "site-packages\tensorflow\python\client\session.py", line 1323, in _do_call
File "site-packages\tensorflow\python\client\session.py", line 1302, in _run_fn
File "site-packages\tensorflow\python\framework\errors_impl.py", line 473, in __exit__
tensorflow.python.framework.errors_impl.ResourceExhaustedError: OOM when allocating tensor with shape[32,256,32,32]
[[Node: model_2/conv2d_8/convolution = Conv2D[T=DT_FLOAT, data_format="NHWC", padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](model_2/pixel_shuffler_3/Reshape_1, conv2d_8/kernel/read)]]
[[Node: loss/mul/_211 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_1601_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
삭제File "train.py", line 111, in
File "site-packages\keras\engine\training.py", line 1839, in train_on_batch
File "site-packages\keras\backend\tensorflow_backend.py", line 2357, in __call__
File "site-packages\tensorflow\python\client\session.py", line 889, in run
File "site-packages\tensorflow\python\client\session.py", line 1120, in _run
File "site-packages\tensorflow\python\client\session.py", line 1317, in _do_run
File "site-packages\tensorflow\python\client\session.py", line 1336, in _do_call
tensorflow.python.framework.errors_impl.ResourceExhaustedError: OOM when allocating tensor with shape[32,256,32,32]
[[Node: model_2/conv2d_8/convolution = Conv2D[T=DT_FLOAT, data_format="NHWC", padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](model_2/pixel_shuffler_3/Reshape_1, conv2d_8/kernel/read)]]
[[Node: loss/mul/_211 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_1601_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
2018-01-27 05:45:10.292055: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:670] Free at 000000055BDDFF00 of size 21748224
삭제2018-01-27 05:45:10.292076: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:676] Summary of in-use Chunks by size:
2018-01-27 05:45:10.292104: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 48 Chunks of size 256 totalling 12.0KiB
2018-01-27 05:45:10.292127: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 6 Chunks of size 512 totalling 3.0KiB
2018-01-27 05:45:10.292158: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 17 Chunks of size 1024 totalling 17.0KiB
2018-01-27 05:45:10.292184: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 1 Chunks of size 1280 totalling 1.3KiB
2018-01-27 05:45:10.292207: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 12 Chunks of size 2048 totalling 24.0KiB
2018-01-27 05:45:10.292229: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 11 Chunks of size 4096 totalling 44.0KiB
2018-01-27 05:45:10.292251: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 1 Chunks of size 7680 totalling 7.5KiB
2018-01-27 05:45:10.292273: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:679] 6 Chunks of size 8192 totalling 48.0KiB
File "site-packages\tensorflow\python\ops\nn_ops.py", line 751, in convolution
삭제File "site-packages\tensorflow\python\ops\nn_ops.py", line 835, in __call__
File "site-packages\tensorflow\python\ops\nn_ops.py", line 499, in __call__
File "site-packages\tensorflow\python\ops\nn_ops.py", line 187, in __call__
File "site-packages\tensorflow\python\ops\gen_nn_ops.py", line 630, in conv2d
File "site-packages\tensorflow\python\framework\op_def_library.py", line 787, in _apply_op_helper
File "site-packages\tensorflow\python\framework\ops.py", line 2956, in create_op
File "site-packages\tensorflow\python\framework\ops.py", line 1470, in __init__
ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[32,256,32,32]
삭제[[Node: model_2/conv2d_8/convolution = Conv2D[T=DT_FLOAT, data_format="NHWC", padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](model_2/pixel_shuffler_3/Reshape_1, conv2d_8/kernel/read)]]
[[Node: loss/mul/_211 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_1601_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
[17564] Failed to execute script train
이게 중요하것같은것만 편집해서 올리건데 문제점이 뭔지 알려주실수있을까여??
oom 에러입니다. 게시글 참고하여 노드랑 레이어 줄여주세요. 사용하고 계신 그래픽카드에 맞는 노드와 레이어 설정을 올려주시면 다른 분들에게도 도움이 된답니다~
삭제저도 동일증상있어서 16 16, 레이어2, 노드 64, ratio 1로 줫더니 해결됬습니다.
삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 145, in
File "align_faces.py", line 92, in main
File "pathlib.py", line 1326, in is_dir
File "pathlib.py", line 1136, in stat
File "pathlib.py", line 387, in wrapped
OSError: [WinError 123] 파일 이름, 디렉터리 이름 또는 볼륨 레이블 구문이 잘못되었습니다: 'C:\\fakes\\data_A, C:\\fakes\\data_B'
[6896] Failed to execute script align_faces
fakeappd을 c드라이브에 압축풀고 다시했더니 이렇게 나오네요...ㅠ
C:\가 되야되는데 C:\\가 되어있네요. 오타확인하여 수정해주시기 바랍니다.
삭제처음 한두번 해보고 Q를 누르면 5초 이내로 자동 종료가 되서
답글삭제합성한 이미지 폴더가 생긴걸 확인했는데
이제는 Q를 눌러도 종료도 안되고 숫자만 계속 움직입니다.
종료방법이 따로 없을까요?
제가아는 한에서는 트레이닝창을 다시한번 클릭하여 q를 누르는 거외에는 없습니다.
삭제시간이 오래 소요될 수는 있지만 원래 시간이 오래걸리는 작업임을 감안해주세요.
그냥 종료했을때 데이터가 남아있는지는 모르겠네요.
train 실행시
답글삭제Using GPU0 for processing
Traceback (most recent call last):
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\platform\self_check.py", line 75, in preload_check
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 174, in __init__
__main__.PyInstallerImportError: Failed to load dynlib/dll 'cudart64_80.dll'. Most probably this dynlib/dll was not found when the application was frozen.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 40, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 12, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 30, in
File "site-packages\tensorflow\python\platform\self_check.py", line 82, in preload_check
ImportError: Could not find 'cudart64_80.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 8.0 from this URL: https://developer.nvidia.com/cuda-toolkit
[5496] Failed to execute script train
라고 나옵니다.. 원인이 뭔가요?
모르시면 모르신다고 답변이라도 주세요.. 24시간 넘게 몇분마다 계속 새로고침 중이에요 ㅠㅠ..
삭제쿠다 까시고 시스템 환경변수 추가해주세요. 이전 글 보시면 나와있습니다.
삭제쿠다 깔았고 환경변수 했는데도 똑같이 뜨네요.. ㅠㅠ 마음이 답답하네요 흐규..
삭제다시 까니까 되네요 ㅡㅡㅋ..
삭제다음으로 넘어 가긴 했는데
Using GPU0 for processing
Using TensorFlow backend.
Focus the training preview window and press 'q' to stop training and save the model
Traceback (most recent call last):
File "train.py", line 104, in
OSError: raw write() returned invalid length 170 (should have been between 0 and 85)
[2552] Failed to execute script train
Focus the training preview window and press 'q' to stop training and save the model
이라고 뜨네요 ㅠㅠ.. 산넘어 산이군요..
우여곡절끝에 해결했습니다!
삭제Extract메뉴에서 스타트 누르면
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy
is 0xb
Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[2504] Failed to execute script align_faces
라고 뜹니다 ㅜㅜ
하라는 대로는 꼼꼼히 했는데 어떻게 해야 고쳐질까요?
train후 start 누르면 cdm창 뜬뒤 몇초뒤
답글삭제Traceback (most recent call last):
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\platform\self_check.py", line 75, in preload_check
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 174, in __init__
__main__.PyInstallerImportError: Failed to load dynlib/dll 'cudart64_80.dll'. Most probably this dynlib/dll was not found when the application was frozen.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 37, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 8, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 30, in
File "site-packages\tensorflow\python\platform\self_check.py", line 82, in preload_check
ImportError: Could not find 'cudart64_80.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 8.0 from this URL: https://developer.nvidia.com/cuda-toolkit
[10352] Failed to execute script train
이런에러가 나오는데 뭐가문제죠 ㅜ
쿠다 까시고 시스템 환경변수 추가해주세요. 이전 글 보시면 나와있습니다.
삭제고생 많으십니다
답글삭제EXtract에서 start 버튼을 눌렀을 때
RuntimeError: module compiled against API version 0xc but this version of numpy
is 0xb
후에 어떤창이 뜨면서 a.exe를 실행할 수 없습니다 라고 나오는데
어떻게 해결해야 할까요.
실행할 수 없는게아니라..a.exe의 작동이 중지되었다네요..
삭제재실행, 반복 시도하시면 해결되실 겁니다.
삭제train 실행시
답글삭제뭐가 엄청 많이 뜨다가 마지막에
c_allocator.cc:217] Allocator (GPU_0_bfc) ran out of memory trying to allocate 1.13GiB. The caller indicates that this is not a failure, but may mean that there could be performance gains if more memory is available.
Loss: 0.214624 0.231371
Printing config file to C://fakes//model\config.p
Saving model weights
Traceback (most recent call last):
File "train.py", line 141, in
ValueError: cannot reshape array of size 294912 into shape (4,7,3,64,64,3)
[7320] Failed to execute script train
라고 뜹니다. 뭐가 문젤까요 ㅠㅠ
혹시나 해서 레이어, 노드 이래저래 조정해봐도 똑같아요 ㅠㅠ
해겼됏습니다. gtx 960 기준 32/32/2/64 하니까 되네요~
삭제변환중에 중간에 다시 위에꺼 뜨면서 꺼져버리네요 ㅠㅠ..
삭제32/32/2/32 하니까 되긴하네요.. 해결했습니다.
답글삭제Using Tensorflow backend.
답글삭제traceback (most recent call last):
file "train.py" line 97,in
file "utils.py" line 16, in load_ images
unboundlocalerror: local variable 'all_images' referenced before assigment
[10964]failed to ececute script train
이렇게 오류뜨는데 해결방법 없을까요
또는 filenotfounderror: model directory not found.
답글삭제[4204] failed to ececute script train
이렇게 뜹니다.
경로 오타로 보입니다.
삭제옵션값이 속도라고 하셨는데, nodes 값은 크고 작아질수록 뭔가요?
답글삭제옵션값이 속도에 영향을 줄 수있는 요소들입니다. 자세한 사항은 https://deeplearning4j.org/kr/neuralnet-overview를 통해 보시는게 좋을 듯 하네요.
삭제음..a.exe가 여전히 실행이 안되서 질문드립니다 ㅠ..
답글삭제한 20번 반복실행해보았는데요
bat을 20번껏다 켜보기도 하고 exract를 눌러 경로만 변경하여 start를 계속 눌러보기 했는데
a.exe가 중지되었다고 계속 메시지가 뜹니다.
fakeapp.bat의 실행 커맨드창에는
Attempting to start Extract process in directory : C:/fakes/alignment
라고 뜨고
extract의 start 창을 누르면
RuntimeError: module compiled against API version 0xc but this version of numpy
is 0xb 후 a.exe 작동이 중지되었습니다로 나옵니다..ㅠ
그래픽카드가 gtx450인데 너무 낮아서 안될 가능성도 있나요?.
삭제gts450 이면 가능은 하실겁니다만 너무 오랜시간이 걸릴 것으로 보입니다. 그래픽 카드를 구매하시는게 원활한 작업을 위해 좋을거라 판단됩니다.
삭제Traceback :
답글삭제File "align_faces.py", line 145, in
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaOccupancyMaxPotentialBlockSizw<&num_blocks,
&num_threads,K> in file c\warhur\dlib-master\dlib\dnn\cuba_utils.h:155. code:8,
reason: invalid device function
[2388] Failed to execute script align_faces
라고 뜹니다. Extract 누르면 계속 뜨네요 ㅜㅠ 알려주신대로 다 했는데 뭐가 문제인가요?
안녕하세요 fakeapp을 실행하고 경로 지정해 준다음에 start를 누르면
답글삭제'C:/FakeApp/alignment/a.exe'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
라고 뜨고 진행이 되지 않습니다.
cuda8.0, java, ,모두 설치 완료 한 상태이고 초반에 환경변수 추가는 이미 되어있어 따로 추가하지는 않았습니다. 혹시 조언좀 얻을 수 있을까요?
cmd 창에서 다른 명령어는 먹으세요? (ipconfig, diskpart등) 다른 명령어에서도 동일하게 나타나시면 c:\windows\system32;(윈도우 설치위치 고려하여 경로작성할 것)를 시스템 환경변수에 추가해보세요. 작업간에 환경변수가 날아갔을 수 있습니다.
삭제gtx 960
답글삭제16 / 100
layers 2 / nodes 64
defalt / false
으로 했더니 잘 됐습니다
A와 B의 얼굴을 이용해서 트레이닝한 모델을 C라는 다른 인물의 영상에 사용하는 것도 가능할까요? 품질이 많이 떨어질건 예상이 되는데 얼마나 영향이 있을지 잘 모르겠네요.
답글삭제그리고 트레이닝에 사용한 이미지가 합성할 영상이 아니라 다른 영상에서 추출한 것이라면 그것도 역시 효율이 많이 떨어질까요?
C를 배경얼굴로 하여 이미 트레이닝한 A의 얼굴을 data를 그대로 이용할 경우, 처음 트레이닝하는것에 비해 크게 작업속도가 향상 됩니다. 하지만 여전히 좋은 품질을 위해서는 긴 시간을 필요로 합니다.
삭제두번쨰 질문은 어떤 의미인지 이해가 잘 가지 않네요. 합성할 영상이 아니라는 것이 무슨 의미이신지?
어떤 영상에 B의 얼굴을 합성할 목적이라면 가장 유사한 이미지인 그 영상에서 추출한 A의 얼굴을 사용해서 트레이닝해야 가장 효과적인가 싶어서요.
삭제그리고 C를 배경으로 사용하고 싶다면 동일한 모델에 A의 데이터만 C로 바꾸어서 다시 트레이닝을 해야 한다는 말씀이시죠? 그럼 이때 이전에 트레이닝 되어있던 A와의 트레이닝 결과는 그대로 유지되나요? 아니면 C와의 트레이닝이 진행됨에 따라 서서히 떨어지게 될까요?
프로그램 사용에 대해서는 이해가 됐는데 기본 개념이 헷갈리는 부분이 많네요.. ㅎㅎ
음 질문드린 요점은 트레이닝에 사용할 A,B와 얼굴과 합성할 대상(영상)의 얼굴이 조금은 차이가 있어도 학습결과가 제대로 적용이 되는지? 그리고 그 차이 정도가 결과물의 품질에 얼마나 큰 영향을 주게 되는지? 라고 할수 있을 것 같습니다.
삭제gmdori님 죄송한데 https://www.reddit.com/r/deepfakes/comments/7v398q/try_using_this_method_for_better_results/. 여기에 글 작성자가 댓글로 써 놓은 방법들좀 번역해 주실 수 있으신가요? 뭐 어찌어찌 반복학습시켜서 더 좋은 결과를 얻었다 하는 내용인데 영알못인지라ㅠㅠ 번역해주셔서 포스팅해주시면 정말 감사하겠습니다
삭제답글삭제
답글
dori gm2018년 2월 7일 오전 6:02
이전에 트레이닝 시킨 모델 데이터를 기본 베이스로 활용하면 더 좋을 결과를 얻을 수 있다고 하네요. 예를 들어 A,B로 만든 모델데이터를 이용하여 모델 데이터만 유지하고 C,D의 이미지파일로 교체하여 트레이닝을 진행하면 C,D의 이미지 만을 이용하여 모델 데이터를 만들때보다 우수한 결과를 얻습니다.(A,B의 데이터를 기반으로 일반적인 얼굴의 조명, 앵글에 따른 변화가 학습되어 있으므로)
예를 들어 다양한 데이터로 학습한 좋은 모델 하나를 범용적으로 사용할 수 있는지 싶어서요
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[11280] Failed to execute script align_faces
이렇게 오류뜹니다 해결법좀요
작성자가 댓글을 삭제했습니다.
답글삭제100% 다되고서 json파일이 생성되지 않고 Failed to execute script align_faces(앞에 코드숫자를 보지못했습니다) 무엇이 문제인가요 ??
답글삭제GTX 1050 계속 OOM 뜨면서 안되다가 16/16 레이어2/노드 64/default/false 하니까 되네요
답글삭제주인장님 좋은 정보 정말 감사드립니다. 다름이 아니라 써주신 대로 따라하다가
답글삭제Using GPU0 for processing
Memory Limit: 1.0 Memory Growth: false
Using TensorFlow backend.
2018-02-04 18:14:01.487048: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\platform\cpu_feature_guard.cc:137] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX
2018-02-04 18:14:01.741121: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\gpu\gpu_device.cc:1030] Found device 0 with properties:
name: GeForce GTX 660 major: 3 minor: 0 memoryClockRate(GHz): 1.0975
pciBusID: 0000:01:00.0
totalMemory: 2.00GiB freeMemory: 1.65GiB
2018-02-04 18:14:01.741453: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\gpu\gpu_device.cc:1120] Creating TensorFlow device (/device:GPU:0) -> (device: 0, name: GeForce GTX 660, pci bus id: 0000:01:00.0, compute capability: 3.0)
2018-02-04 18:14:01.743438: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_driver.cc:936] failed to allocate 2.00G (2147483648 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
2018-02-04 18:14:01.743545: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_driver.cc:936] failed to allocate 1.80G (1932735232 bytes) from device: CUDA_ERROR_OUT_OF_MEMORY
Focus the training preview window and press 'q' to stop training and save the model
2018-02-04 18:16:05.162808: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
2018-02-04 18:16:05.165829: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
2018-02-04 18:16:05.179610: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
2018-02-04 18:16:05.179804: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
2018-02-04 18:16:05.180370: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
2018-02-04 18:16:05.180762: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_blas.cc:366] failed to create cublas handle: CUBLAS_STATUS_ALLOC_FAILED
2018-02-04 18:16:07.230671: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_dnn.cc:385] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED
2018-02-04 18:16:07.232048: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_dnn.cc:389] error retrieving driver version: Unimplemented: kernel reported driver version not implemented on Windows
2018-02-04 18:16:07.233268: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\stream_executor\cuda\cuda_dnn.cc:352] could not destroy cudnn handle: CUDNN_STATUS_BAD_PARAM
2018-02-04 18:16:07.233431: F C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\kernels\conv_ops.cc:667] Check failed: stream->parent()->GetConvolveAlgorithms( conv_parameters.ShouldIncludeWinogradNonfusedAlgo(), &algorithms)
이렇게 에러가 뜨네요. 말씀하신대로 CUDA 깔고 환경변수 추가하고 시스템 OOM에러가 뜨길래 옵션값을 각각 10/10 레이어1 노드 64까지 조정한 상태인데, 이번엔 CUDA에서 오류가 뜨는 것 같네요.
원인이 뭘까요? GPU는 GTX660 사용중입니다.
아, 해결했습니다. CUDA 8.0 에서는 Visual Studio 2017을 인식 못하는 문제가 있어서 Visual Studio 2015로 다운그레이드 하니 되네요. 같은 오류 뜨시는 분들 참고 바랍니다.
삭제그 문제가 아니군요... 잠시 되는 듯 하다가 다시 CUDA MOO 뜨네요... 해결책 아시는 분들 답변 바랍니다.
삭제사진 장 수를 줄이니까 해결이 되네요.
삭제안녕하세요. 질문이 있는데요...
답글삭제마이크로 얼굴 살짝가려도 안되나요?
Using GPU0 for processing
답글삭제Traceback (most recent call last):
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\platform\self_check.py", line 75, in preload_check
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 174, in __init__
__main__.PyInstallerImportError: Failed to load dynlib/dll 'cudart64_80.dll'. Most probably this dynlib/dll was not found when the application was frozen.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 40, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 12, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 30, in
File "site-packages\tensorflow\python\platform\self_check.py", line 82, in preload_check
ImportError: Could not find 'cudart64_80.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 8.0 from this URL: https://developer.nvidia.com/cuda-toolkit
[19680] Failed to execute script train
모듈에러뜨던데 해결방법 부탁드립니다.
Traceback (most recent call last):
답글삭제File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\platform\self_check.py", line 75, in preload_check
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 174, in __init__
__main__.PyInstallerImportError: Failed to load dynlib/dll 'cudart64_80.dll'. Most probably this dynlib/dll was not found when the application was frozen.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 37, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 8, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 30, in
File "site-packages\tensorflow\python\platform\self_check.py", line 82, in preload_check
ImportError: Could not find 'cudart64_80.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 8.0 from this URL: https://developer.nvidia.com/cuda-toolkit
[12748] Failed to execute script train
이렇게 에러뜨는데 해결방법 부탁드립니다.
~~~
답글삭제2018-02-07 11:08:06.166760: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:685] Stats:
Limit: 563916800
InUse: 523441920
MaxInUse: 540219136
NumAllocs: 110
MaxAllocSize: 75497472
2018-02-07 11:08:06.167760: W C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\core\common_runtime\bfc_allocator.cc:277] ********************
****_************************************************************************___
2018-02-07 11:08:06.167760: W C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\core\framework\op_kernel.cc:1192] Resource exhausted: OOM when
allocating tensor with shape[3,3,1024,2048]
Traceback (most recent call last):
File "site-packages\tensorflow\python\client\session.py", line 1323, in _do_ca
ll
File "site-packages\tensorflow\python\client\session.py", line 1302, in _run_f
n
File "site-packages\tensorflow\python\framework\errors_impl.py", line 473, in
__exit__
tensorflow.python.framework.errors_impl.ResourceExhaustedError: OOM when allocat
ing tensor with shape[3,3,1024,2048]
[[Node: conv2d_3/kernel/Assign = Assign[T=DT_FLOAT, _class=["loc:@conv2
d_3/kernel"], use_locking=true, validate_shape=true, _device="/job:localhost/rep
lica:0/task:0/device:GPU:0"](conv2d_3/kernel, conv2d_3/random_uniform)]]
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 108, in
File "site-packages\keras\engine\training.py", line 1839, in train_on_batch
File "site-packages\keras\backend\tensorflow_backend.py", line 2355, in __call
__
File "site-packages\keras\backend\tensorflow_backend.py", line 189, in get_ses
sion
File "site-packages\tensorflow\python\client\session.py", line 889, in run
File "site-packages\tensorflow\python\client\session.py", line 1120, in _run
File "site-packages\tensorflow\python\client\session.py", line 1317, in _do_ru
n
File "site-packages\tensorflow\python\client\session.py", line 1336, in _do_ca
ll
tensorflow.python.framework.errors_impl.ResourceExhaustedError: OOM when allocat
ing tensor with shape[3,3,1024,2048]
[[Node: conv2d_3/kernel/Assign = Assign[T=DT_FLOAT, _class=["loc:@conv2
d_3/kernel"], use_locking=true, validate_shape=true, _device="/job:localhost/rep
lica:0/task:0/device:GPU:0"](conv2d_3/kernel, conv2d_3/random_uniform)]]
Caused by op 'conv2d_3/kernel/Assign', defined at:
File "train.py", line 37, in
File "", line 968, in _find_and_load
File "", line 957, in _find_and_load_unlocked
File "", line 673, in _load_unlocked
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_i
mporters.py", line 631, in exec_module
File "model.py", line 78, in
File "model.py", line 66, in Encoder
File "model.py", line 44, in block
File "site-packages\keras\engine\topology.py", line 576, in __call__
File "site-packages\keras\layers\convolutional.py", line 134, in build
File "site-packages\keras\legacy\interfaces.py", line 87, in wrapper
File "site-packages\keras\engine\topology.py", line 400, in add_weight
File "site-packages\keras\backend\tensorflow_backend.py", line 385, in variabl
e
File "site-packages\tensorflow\python\ops\variables.py", line 213, in __init__
File "site-packages\tensorflow\python\ops\variables.py", line 346, in _init_fr
삭제om_args
File "site-packages\tensorflow\python\ops\state_ops.py", line 276, in assign
File "site-packages\tensorflow\python\ops\gen_state_ops.py", line 56, in assig
n
File "site-packages\tensorflow\python\framework\op_def_library.py", line 787,
in _apply_op_helper
File "site-packages\tensorflow\python\framework\ops.py", line 2956, in create_
op
File "site-packages\tensorflow\python\framework\ops.py", line 1470, in __init_
_
ResourceExhaustedError (see above for traceback): OOM when allocating tensor wit
h shape[3,3,1024,2048]
[[Node: conv2d_3/kernel/Assign = Assign[T=DT_FLOAT, _class=["loc:@conv2
d_3/kernel"], use_locking=true, validate_shape=true, _device="/job:localhost/rep
lica:0/task:0/device:GPU:0"](conv2d_3/kernel, conv2d_3/random_uniform)]]
[7804] Failed to execute script train
train 단계인데 oom은 cpu 옵션수치 문제라는 글들밖에없길래
옵션관련 수치 예시들부터 1까지 점점 줄이면서 다해봤는데도 항상 답은 같네요
변수 추가했고 cuda 8.0 설치했습니다 GTX 630 이고요 도움 부탁드립니다
작성자가 댓글을 삭제했습니다.
삭제영상에서 약 700kb되는 사진들을 추출해서, 얼굴까지 뽑아냈는데 여기서 계속 막히네요 ㅠㅠ
답글삭제Using TensorFlow backend.
Focus the training preview window and press 'q' to stop training and save the model
Traceback (most recent call last):
File "train.py", line 105, in
File "training_data.py", line 17, in get_training_data
File "image_augmentation.py", line 21, in random_warp
AssertionError: MESSAGE: Your images are the wrong size. Images used for training should be 256x256 images produced by the Align tool.
[23020] Failed to execute script train
ㅇㅈㅜㅜ 저도 거기서 막힘
삭제Using TensorFlow backend.
답글삭제Traceback (most recent call last):
File "train.py", line 97, in
MemoryError
[6972] Failed to execute script train
C:\FakeApp>
계속 이렇게 뜹니다.
변수 추가했고 경로 수동입력 다 했고 16/16/레이어2/노드128/디폴트/false
도움 부탁드립니다
사진파일 갯수줄여서 해보세요.
삭제갯수 줄였더니 저런 현상은 안뜨는데
삭제_
ResourceExhaustedError (see above for traceback): OOM when allocating tensor wit
h shape[3,3,1024,2048]
[[Node: conv2d_3/kernel/Assign = Assign[T=DT_FLOAT, _class=["loc:@conv2
d_3/kernel"], use_locking=true, validate_shape=true, _device="/job:localhost/rep
lica:0/task:0/device:GPU:0"](conv2d_3/kernel, conv2d_3/random_uniform)]]
[7716] Failed to execute script train
C:\FakeApp>
가 뜨네요, 옵션수치를 계속 하향조정해도 같습니다 더 줄여나가야되나요?
고리님 도와주세요....ㅠㅠ
삭제ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[32,2048,4,4]
답글삭제[[Node: model_1/conv2d_5/convolution = Conv2D[T=DT_FLOAT, data_format="NHWC", padding="SAME", strides=[1, 1, 1, 1], use_cudnn_on_gpu=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](model_1/reshape_1/Reshape, conv2d_5/kernel/read)]]
[[Node: loss/mul/_211 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_1601_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
[45536] Failed to execute script train
어느정도 진행되다가 갑자기 이런 메세지가 송출되네요 ㅠ
절전모드 되서 켰더니 윈도우 마우스만나오고 아무것도 안나오는 절전모드 먹통증상나와서 재부팅해서 다시 켰더니 다날라가버렸네요. 절전모드 절대 해제 하세요. 몇시간한거 다날라가서 뭐하나 부술번했네요.
답글삭제RuntimeError: Error while calling cudaOccupancyMaxPotentialBlockSize(&num_blocks,&num_threads,K) in file c:\arthur\dlib-master\dlib\dnn\cuda_utils.h:155. code: 8, reason: invalid device function
답글삭제[7712] Failed to execute script align_faces
이렇게 뜨네요...
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 프로시저를 찾을 수 없습니다.
[44720] Failed to execute script align_faces
안녕하세요 항상 고생 많으십니다. extract 진행중 이런 오류가 나오는데 어떤 문제일지 조언 부탁드립니다.
ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[3,3,1024,2048]
답글삭제[[Node: training/Adam/mul_31 = Mul[T=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:GPU:0"](Adam/beta_1/read, training/Adam/Variable_6/read)]]
[[Node: loss/mul/_175 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/device:CPU:0", send_device="/job:localhost/replica:0/task:0/device:GPU:0", send_device_incarnation=1, tensor_name="edge_1205_loss/mul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
[6312] Failed to execute script train
train인가 에서 막혀요 도와줘요
Using TensorFlow backend.
답글삭제Traceback (most recent call last):
File "train.py", line 96, in
File "utils.py", line 15, in load_images
ValueError: could not broadcast input array from shape (240,320,3) into shape (256,256,3)
[12904] Failed to execute script train
이렇게 나오는데 어떻게 해야 하나요? ㅠㅠ
안녕하세요..잘보고 따라하고있는데 extract 에서 start를 누르면
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy
is 0xb
Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[11608] Failed to execute script align_faces
C:\FakeApp>
라고 뜹니다..
2015 C++ 도 다운받았는데.. 뭐가 문제인질 도저히 모르겠네요..
ㅜㅜ 괴롭습니다
혹시 해결하셨나요? 저도 똑같은상황이네요..ㅠㅠ
삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 62, in
File "face_alignment\api.py", line 87, in __init__
RuntimeError: Error while calling cudaGetDevice(&the_device_id) in file C:\Arthur\dlib-master\dlib\dnn\gpu_data.cpp:178. code: 35, reason: CUDA driver version is insufficient for CUDA runtime version
[5056] Failed to execute script align_faces
이게 무슨말인지요 ㅠㅠ
이 다음글 주소가 안뜨네요 ㅠ
답글삭제오른쪽 페이지에서 찾으니까 있네요. (4) 현재 본문의 맨아래링크로는 저만그런지 모르겠지만 찾을수없다뜹니다. 수정해주시면 좋을것같아요 :)
삭제감사합니다. 수정했습니다.
삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[1876] Failed to execute script align_faces
C:\FakeApp>
댓글들 하나하나 정독했는데 이문제는 정말 방법이 없는건가요?
gtx 시리즈가 아니면 안되나요? 라데온 쓰는데.. 방법이 없을까요?
답글삭제댓글 하나하나 다정독했는데 같은증상은 없는거같습니다 ..ㅠㅠ
답글삭제Using TensorFlow backend.
2018-02-23 01:37:01.678111: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\core\platform\cpu_feature_guard.cc:137] Your CPU supports inst
ructions that this TensorFlow binary was not compiled to use: AVX
2018-02-23 01:37:01.816119: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\stream_executor\cuda\cuda_driver.cc:406] failed call to cuInit
: CUDA_ERROR_NO_DEVICE
2018-02-23 01:37:01.944126: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\stream_executor\cuda\cuda_diagnostics.cc:158] retrieving CUDA
diagnostic information for host: User -701251326
2018-02-23 01:37:01.947126: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\stream_executor\cuda\cuda_diagnostics.cc:165] hostname: User -
701251326
Traceback (most recent call last):
File "train.py", line 96, in
MemoryError
[9204] Failed to execute script train
D:\FakeApp\FakeApp>
이와같은 문구가뜨는데 해결방법이있나요? c용량이 부족하여 d디스크로 옮겨서했습니다
사진크기 720안넘고 cuda 8.0 깔았어요
답글삭제사진갯수를 대폭줄이고 실행했더니
답글삭제Using TensorFlow backend.
2018-02-23 01:54:04.945639: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\core\platform\cpu_feature_guard.cc:137] Your CPU supports inst
ructions that this TensorFlow binary was not compiled to use: AVX
2018-02-23 01:54:05.027643: E C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\stream_executor\cuda\cuda_driver.cc:406] failed call to cuInit
: CUDA_ERROR_NO_DEVICE
2018-02-23 01:54:05.037644: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\stream_executor\cuda\cuda_diagnostics.cc:158] retrieving CUDA
diagnostic information for host: User -701251326
2018-02-23 01:54:05.040644: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu
\PY\35\tensorflow\stream_executor\cuda\cuda_diagnostics.cc:165] hostname: User -
701251326
Traceback (most recent call last):
File "train.py", line 97, in
File "utils.py", line 15, in load_images
ValueError: could not broadcast input array from shape (90,83,3) into shape (256
,256,3)
[12032] Failed to execute script train
D:\FakeApp\FakeApp>
이렇게뜹니다 ㅠㅠㅠ
액서스가 거부되었습니다.라고 뜨네요 떻게 해야하죠..
답글삭제죄송한데 Visula Studio 패키지도 설치하고 Cuda, 등 다 다시 설치해 봤는데도
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy
is 0xb
Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[14824] Failed to execute script align_faces
이라고 뜨네여 뭐가 문제일까요?ㅠ
0.014~0.018을 5시간째 왔다갔다하는데 트레이닝되고있는거 맞죠?
답글삭제0.02 밑으로 내려가면 꽤 괜찮은 결과물을 얻을 수 있었습니다. 댓글 작성자 분께서는 굉장히 좋은 결과물을 얻으셨을 것 같네요..^^
삭제작성자가 댓글을 삭제했습니다.
답글삭제Using GPU0 for processing
삭제Using TensorFlow backend.
Traceback (most recent call last):
File "train.py", line 100, in
MemoryError
[10592] Failed to execute script train
train 돌리면 이렇게 뜨는데
혹시 뭐가 문제일까요?
Extract 눌렀는데 runtime error:module compiled against API version 0xc but this version of numpy is 0xh 이 글만 첫줄에 뜨고 화면이 멈췄어요 마우스도 안움직이고 화면이 아예 멈춰버렸는데
답글삭제에러인가요? 무엇이 문제인가요!
기다려야 되는걸까요..
기다려 보시구요. 그 줄은 그냥 처음실행할 때 나오는 줄이기 때문에 어떤것이 원인인지 이글만으로 알기는 어렵네요
삭제작성자가 댓글을 삭제했습니다.
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 145, in
File "align_faces.py", line 92, in main
AssertionError: Can't find input directory C:\fakes\data_B
[10692] Failed to execute script align_faces
아무리찾아보고 노브도 다시깔아봐도 뭐가문제인지 모르겟소욤 ㅠㅠ
NVIDIA GeForce GTX 960 그래픽카드 문제인가요????
Using GPU0 for processing
답글삭제Traceback (most recent call last):
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\platform\self_check.py", line 75, in preload_check
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 174, in __init__
__main__.PyInstallerImportError: Failed to load dynlib/dll 'cudart64_80.dll'. Most probably this dynlib/dll was not found when the application was frozen.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 40, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 12, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 30, in
File "site-packages\tensorflow\python\platform\self_check.py", line 82, in preload_check
ImportError: Could not find 'cudart64_80.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 8.0 from this URL: https://developer.nvidia.com/cuda-toolkit
[7784] Failed to execute script train
에러가 엄청나네요... 왜이러는지 참.. 답답해요 ㅠㅠ
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[8024] Failed to execute script align_faces
이 에러가 어떤 에러인가요?? ㅜㅜ
다른 댓글 대로 버추어c 그거 깔아도 계속 이런 오류가 뜨네요 ㅠㅠ
Traceback (most recent call last):
답글삭제File "site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 18, in swig_import_helper
File "importlib\__init__.py", line 126, in import_module
File "", line 985, in _gcd_import
File "", line 968, in _find_and_load
File "", line 955, in _find_and_load_unlocked
ImportError: No module named 'tensorflow.python._pywrap_tensorflow_internal'
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 58, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 21, in
File "site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 20, in swig_import_helper
File "importlib\__init__.py", line 126, in import_module
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 714, in load_module
ImportError: DLL load failed: 지정된 프로시저를 찾을 수 없습니다.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 37, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 8, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 72, in
ImportError: Traceback (most recent call last):
File "site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 18, in swig_import_helper
File "importlib\__init__.py", line 126, in import_module
File "", line 985, in _gcd_import
File "", line 968, in _find_and_load
File "", line 955, in _find_and_load_unlocked
ImportError: No module named 'tensorflow.python._pywrap_tensorflow_internal'
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 58, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 21, in
File "site-packages\tensorflow\python\pywrap_tensorflow_internal.py", line 20, in swig_import_helper
File "importlib\__init__.py", line 126, in import_module
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 714, in load_module
ImportError: DLL load failed: 지정된 프로시저를 찾을 수 없습니다.
분명 잘못된게 없는데 다해봤는데도 이러네요
버추어c도 cuda8.0도 환경변수도 다해봤는데 도대체 어떤문젠가요?
File "train.py", line 99, in
답글삭제MemoryError
[2880] Failed to execute script train
아니면
error [200] : program aborting due to control-C event
이렇게 뜨는데 문제가 뭔지 모르겠습니다 ㅜ
그래픽카드는 1060[3G], 램 8G인데
삭제2,2,2,2,1 해도 진행이 안되네요 ㅜㅜ
파일 수가 많아도 시작이 안되는건가요?
자료가 많기는 한데..
Using GPU0 for processing
답글삭제Using TensorFlow backend.
Focus the training preview window and press 'q' to stop training and save the model
2018-04-15 21:11:16.021762: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\platform\cpu_feature_guard.cc:137] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2
2018-04-15 21:11:17.092707: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\gpu\gpu_device.cc:1030] Found device 0 with properties:
name: GeForce GTX 1060 3GB major: 6 minor: 1 memoryClockRate(GHz): 1.7085
pciBusID: 0000:01:00.0
totalMemory: 3.00GiB freeMemory: 2.47GiB
2018-04-15 21:11:17.102217: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\gpu\gpu_device.cc:1120] Creating TensorFlow device (/device:GPU:0) -> (device: 0, name: GeForce GTX 1060 3GB, pci bus id: 0000:01:00.0, compute capability: 6.1)
2Loss: 0.189429 0.161747
Printing config file to D:/fakes/model\config.p
Saving model weights
forrtl: error (200): program aborting due to control-C event
Image PC Routine Line Source
libifcoremd.dll 00007FFBF6BD94C4 Unknown Unknown Unknown
KERNELBASE.dll 00007FFC1AA77EDD Unknown Unknown Unknown
KERNEL32.DLL 00007FFC1CC31FE4 Unknown Unknown Unknown
ntdll.dll 00007FFC1DC5F061 Unknown Unknown Unknown
ㅜㅜ이번엔 이렇게 뜨네요
fakeapp 실행 후 본문에 적힌 방법대로 설정하고 실행을 했습니다.
답글삭제cmd 창이 하나 더 뜨면서 C:FakeApp 라는 글자밖에 안나오는데 무엇이 잘못되었는지..ㅠㅠ
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제0%| | 0/15 [00:00
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaMalloc(&data, n) in file C:\Arthur\dlib-master\dlib\dnn\cuda_data_ptr.cpp:28. code: 2, reason: out of memory
[15392] Failed to execute script align_faces
이건 무슨 오류일까요 ㅠㅠ
Using GPU0 for processing
답글삭제Traceback (most recent call last):
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
라는 오류가나옵니다
작성자가 댓글을 삭제했습니다.
답글삭제Traceback (most recent call last):
답글삭제File "train.py", line 110, in
OSError: raw write() returned invalid length 56 (should have been between 0 and 28)
[20944] Failed to execute script train
Loss: 0.0189448 0.0232654
Exception ignored in: >
Traceback (most recent call last):
File "site-packages\tensorflow\python\client\session.py", line 696, in __del__
TypeError: 'NoneType' object is not callable
이건 어떻게 하나요 첨에 잘 되다가 중간에 멈췄어요
작성자가 댓글을 삭제했습니다.
답글삭제김정무2018년 4월 24일 오전 2:29
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy
is 0xb
0%| | 0/14 [00:00
File "align_faces.py", line 145, in
File "align_faces.py", line 136, in main
File "align_faces.py", line 116, in iter_face_alignments
File "face_alignment\api.py", line 172, in get_landmarks
File "face_alignment\api.py", line 160, in detect_faces
RuntimeError: Error while calling cudaOccupancyMaxPotentialBlockSize(&num_blocks
,&num_threads,K) in file c:\arthur\dlib-master\dlib\dnn\cuda_utils.h:155. code:
8, reason: invalid device function
[5384] Failed to execute script align_faces
이거 도대체 왜이러는건가요.ㅠㅠ
File "ctypes\__init__.py", line 351, in __init__
답글삭제OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
File "ctypes\__init__.py", line 351, in __init__
삭제OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
라고 뜨는데 이거 왜그런건가요 ㅠㅜ
지금 까지 오류 해결한 방법을 보자면, cuda를 cuda만 설치하면 되는줄알았는데 나같은경우는 그게 아니었고 빠른설치로 모두 설치 하니까 됨. C++ 2015를 받아서 설치했는데 이미 설치되어있다길래 그런가보다 했는데, 2017을 삭제하고 2015를 깔았어야됨.
답글삭제자잘한 실수로는 ffmpeg을 c드라이브에 압축풀때 하위폴더 같은이름?폴더생성이 체크되어있어서 인식을 못했던적이 있었다.
삭제fakeapp.bat 프로그램을 실행시켜도 명령 프롬포트가 열렸다가 꺼지기만 하는데 어떻게 해야되나요..?
답글삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 62, in
File "face_alignment\api.py", line 87, in __init__
RuntimeError: Unable to open C:\Users\박영환\Desktop\hap\FakeApp\FakeApp\alignment\mmod_human_face_detector.dat for reading.
[9196] Failed to execute script align_faces
이런 에러는 어떻게 해결해야 할까요?
Traceback (most recent call last):
답글삭제File "train.py", line 99, in
File "utils.py", line 15, in load_images
TypeError: int() argument must be a string, a bytes-like object or a number, not 'NoneType'
[1228] Failed to execute script train
Exception ignored in: >
Traceback (most recent call last):
File "site-packages\tensorflow\python\client\session.py", line 696, in __del__
File "site-packages\tensorflow\python\framework\c_api_util.py", line 30, in __init__
TypeError: 'NoneType' object is not callable
어제까지 되던게 갑자기 안되면서 이런 글이 올라오는데 왜 그런거죠?
RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
답글삭제Traceback (most recent call last):
File "align_faces.py", line 7, in
File "C:\FakeApp\alignment\torch\__init__.py", line 76, in
from torch._C import *
ImportError: DLL load failed: 지정된 모듈을 찾을 수 없습니다.
[12988] Failed to execute script align_faces
진행이 불가능합니다 도아주세요 ㅜㅜ
작성자가 댓글을 삭제했습니다.
답글삭제작성자가 댓글을 삭제했습니다.
답글삭제작성자가 댓글을 삭제했습니다.
답글삭제Using GPU0 for processing
답글삭제Using TensorFlow backend.
Cannot find images. Make sure the data directory paths are properly entered.
Traceback (most recent call last):
File "train.py", line 99, in
File "utils.py", line 20, in load_images
UnboundLocalError: local variable 'all_images' referenced before assignment
[14076] Failed to execute script train
D:\FakeApp>Using GPU0 for processing
'Using'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>Using TensorFlow backend.
'Using'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>Cannot find images. Make sure the data directory paths are properly entered.
'Cannot'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>Traceback (most recent call last):
'Traceback'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp> File "train.py", line 99, in
명령 구문이 올바르지 않습니다.
D:\FakeApp> File "utils.py", line 20, in load_images
'File'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>UnboundLocalError: local variable 'all_images' referenced before assignment
'UnboundLocalError:'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>[14076] Failed to execute script train
'[14076]'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>
D:\FakeApp>D:\FakeApp>Using GPU0 for processing
'D:\FakeApp'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>Using TensorFlow backend.
'Using'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>Cannot find images. Make sure the data directory paths are properly entered.
'Cannot'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>Traceback (most recent call last):
'Traceback'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp> File "train.py", line 99, in
명령 구문이 올바르지 않습니다.
D:\FakeApp> File "utils.py", line 20, in load_images
'File'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>UnboundLocalError: local variable 'all_images' referenced before assignment
'UnboundLocalError:'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>[14076] Failed to execute script train
'[14076]'은(는) 내부 또는 외부 명령, 실행할 수 있는 프로그램, 또는
배치 파일이 아닙니다.
D:\FakeApp>
D:\FakeApp>D:\FakeApp>
이렇게뜨네요.....
Using GPU0 for processing
답글삭제Traceback (most recent call last):
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 172, in __init__
File "ctypes\__init__.py", line 351, in __init__
OSError: [WinError 126] 지정된 모듈을 찾을 수 없습니다
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "site-packages\tensorflow\python\platform\self_check.py", line 75, in preload_check
File "site-packages\PyInstaller\loader\pyiboot01_bootstrap.py", line 174, in __init__
__main__.PyInstallerImportError: Failed to load dynlib/dll 'cudart64_80.dll'. Most probably this dynlib/dll was not found when the application was frozen.
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "train.py", line 40, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "model.py", line 12, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\__init__.py", line 24, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\__init__.py", line 49, in
File "d:\anaconda\envs\merging\lib\site-packages\PyInstaller\loader\pyimod03_importers.py", line 631, in exec_module
File "site-packages\tensorflow\python\pywrap_tensorflow.py", line 30, in
File "site-packages\tensorflow\python\platform\self_check.py", line 82, in preload_check
ImportError: Could not find 'cudart64_80.dll'. TensorFlow requires that this DLL be installed in a directory that is named in your %PATH% environment variable. Download and install CUDA 8.0 from this URL: https://developer.nvidia.com/cuda-toolkit
[5924] Failed to execute script train
이렇게 뜨네요 어떤게 문제려나요?
Found GPU0 GeForce RTX 2060 which requires CUDA_VERSION >= 8000 for
답글삭제optimal performance and fast startup time, but your PyTorch was compiled
with CUDA_VERSION 8000. Please install the correct PyTorch binary
using instructions from http://pytorch.org
warnings.warn(error_str % (d, name, 8000, CUDA_VERSION))
얼굴추출할때 이런 오류가 발생합니다 찾아봐도 이런 오류뜨는분들은 안계시네요 쿠다 버전 확인 해보면 8.0 으로 설치가 잘 되어있습니다
저도 그러네요. rtx 그래픽카드를 사용하면 생기는 오류인가봐요..
삭제RuntimeError: module compiled against API version 0xc but this version of numpy is 0xb
C:\FakeApp\alignment\torch\cuda\__init__.py:108: UserWarning:
Found GPU0 GeForce RTX 2080 Ti which requires CUDA_VERSION >= 8000 for
optimal performance and fast startup time, but your PyTorch was compiled
with CUDA_VERSION 8000. Please install the correct PyTorch binary
using instructions from http://pytorch.org
warnings.warn(error_str % (d, name, 8000, CUDA_VERSION))
구동을 시켜고 작업 관리자를 보면 cpu 점유율은 48~58% 정도 하는데 gpu는 8%정도 밖에 안됩니다.
답글삭제이러면 gpu가 아니라 cpu로 계산하고 있는건가요?
그리고 저도 윗분들과 같은 에러가 발생했었는데 일단 쿠다를 8.0으로 설치, 명령 프롬프트에 py 입력해 파이썬 실행을 하고 난 후에 돌리면 시간이 쫌 지나고 나서 구동되더군요
Using TensorFlow backend.
답글삭제Focus the training preview window and press 'q' to stop training and save the model
2020-05-04 13:38:38.802517: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\platform\cpu_feature_guard.cc:137] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX AVX2
2020-05-04 13:38:38.971550: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\gpu\gpu_device.cc:1030] Found device 0 with properties:
name: GeForce RTX 2080 major: 7 minor: 5 memoryClockRate(GHz): 1.815
pciBusID: 0000:01:00.0
totalMemory: 8.00GiB freeMemory: 6.55GiB
2020-05-04 13:38:38.978323: I C:\tf_jenkins\home\workspace\rel-win\M\windows-gpu\PY\35\tensorflow\core\common_runtime\gpu\gpu_device.cc:1120] Creating TensorFlow device (/device:GPU:0) -> (device: 0, name: GeForce RTX 2080, pci bus id: 0000:01:00.0, compute capability: 7.5)
Loss: inf 0.192744
Printing config file to e:/fakes/model\config.p
Saving model weights
Loss: inf 0.188966
Loss: inf 0.179115
Loss: inf 0.1879
이렇게 되면서 프리뷰 창에는 b의 얼굴만 나오고 a는 나오지 않습니다.
도대체 왜 그런걸까요..?
힘드네요 트레인과정에서 자꾸
답글삭제training process ended if you did not end it yourself,an error occurred.check the end of the log.txt file for details,and feel free
to post it on fakeapp.org/forum for help.
에러 팝업창뜹니다;;; 검색해봐도 저같은 에러는없는거같아서요...ㅠㅠ