핫게 실시간 커뮤니티 인기글
종합 (4209354)  썸네일on   다크모드 on
죄수번호.. | 25/02/04 18:53 | 추천 23 | 조회 94

[유머] 팟플레이어로 자동 AI 자막을 생성해보자!! +94 [9]

루리웹 원문링크 https://m.ruliweb.com/best/board/300143/read/69419733

★ 참고 - 시작하기앞서 이 기능은 일본어를 번역을 하는것으로 목표로 정합니다. 



1. 팟플레이어 최신버전을 다운로드 설치 한다. (설치 완료후 반드시 관리자 권한으로 실행)

https://tv.kakao.com/guide/potplayer




img/25/02/04/194d042caf0576058.png



2. 자동 자막 생성하기전 준비 과정이 있다. 환경설정 메뉴를 불러온후 


자막 - 소리로 자막생성 - 소리로 자막생성 툴 실행을 눌러준다.




img/25/02/04/194d042ccb4576058.png



3. 소리자막 생성 툴이 실행이 된다. 이제 여기서 엔진과 모델 2가지를 설정 선택해야한다.



img/25/02/04/194d042ceb3576058.png



4. 개인적으로 내 컴퓨터의 CPU성능이 엄청 좋다면 CPU엔진을 선택하면되고 성능이 안좋은 컴퓨터라면

소프트웨어 버전인 Faster를 선택하면된다.


(벌칸과 쿠다 버전도 있으나 현재 버그인지 작동안하는 문제가 있음.그래픽카드 지원유무 차이인듯)



img/25/02/04/194d042d0a5576058.png


5. 모델을 선택해야하는데 이것은 해당 미디어의 소리를 어느급으로 해석할것이냐의 알고리즘이다.

tiny가 제일 빠르고 medium이 중간 large가 제일 좋음이다.


(tiny가 번역수준 제일 처참하지만 기본적으로 어떤 문맥인지 파악할때 하면좋고 미디움은 딱 중간 성능. large는 시간빌게이츠를 위한

기능으로 GPT 모델을 사용하며 거의 완벽하게 소리 추출기능하다.) 개발자의 주장으로 v3기준 128 Mel 주파수 빈 학습률 이라고함

https://huggingface.co/openai/whisper-large-v3




img/25/02/04/194d042d2ca576058.png



6.이제 준비는 끝났다. 재생할려는 영상을 실행한후 아까의 소리추출 툴에서 추출하려는 언어를 재패니즈(일본)로 설정해두고


시작 버튼을 누른다 (재생시 자막 자동생성 기능체크는 취향껏)


이후 약 30초에서 1분정도 기다리면 미디어 음성파일을 추출시작하며 본격적으로 자막이 생성(추출) 시작된다.

(만약 소리 번역 추출이 완료 됐다면 100% 컴플리트 라며 알려준다. 또한 소리추출번역 시간은 생각보다 오래걸린다.

미디움 기준 30분걸림. 당연히 large 모델로 선택하면 더 오래 걸린다.)



img/25/02/04/194d05b19fa576058.png



7. 자막을 재생시켜보자. 환경설정 - 자막 - 실시간 자막 번역 - 번역엔진 선택 하면끝

(개인적으로 구글이 번역수준 높다고 생각되나 취향껏 선택, 또한 자막보이기 체크는 필수) 


(참고 - 자막 번역과 동시에 보고싶다면 6번 사항에서 재생중인 미디어를 0초로 다시 되돌리면 자막이 보이면서 즐길수있다)




img/25/02/04/194d042d494576058.png


8. 6번 사항에서 100%번역이 완료 되었다면 자막을 따로 저장할수도있다. (.srt파일명으로 저장된다)






이제 즐겨라!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!



[신고하기]

댓글(9)

이전글 목록 다음글

12 3 4 5
    
제목 내용