slider01 slider02 slider03

 

Cho, Hyesun. 2021. Predicting the gender of Korean personal names using fastText. Studies in Phonetics, Phonology and Morphology 27.3. 483-500. Male and female names tend to have distinct phonotactic characteristics in many languages. This paper explores the use of fastText, a neural-network text-classifier using sub-word information, in predicting the gender of Korean personal names, and compares the results with the results from a maximum-entropy model of phonotactics (Hayes and Wilson 2008). In this study, fastText is trained with training data consisting of 6400 Korean personal names, labeled with male and female. The model is tested with testing data of 35 Korean names. The fastText results positively correlated with Korean speakers’ ratings on the gender of the names. It outperformed the maximum-entropy model in terms of correlation with human ratings and accuracy of the labels. Yet, while the maximum-entropy model has OT-style constraints allowing generative linguists to interpret the results, fastText does not offer such interpretability. An error analysis is presented for the names where the models made incorrect predictions, using OT-style constraints.


Keywords: name, gender, phonotactics, maximum-entropy, neural network, fastText, sound symbolism 


[pdf]

번호 제목 글쓴이 날짜 조회 수
공지 [음성음운형태론연구] 온라인 논문 투고 안내 (2023년 1월 14일 수정) Manager 2016.09.02 32417
공지 [음성음운형태론연구] 논문 투고시 유의사항 (2023년 1월 14일 수정) Manager 2013.04.27 40967
650 음성.음운.형태론연구 3집, 강현숙 file 관리자 2013.02.04 3074
649 음성.음운.형태론연구 3집, 김형엽 file 관리자 2013.02.04 3195
648 음성.음운.형태론연구 3집, 박천배 file 관리자 2013.02.04 3828
647 음성.음운.형태론연구 3집, 손형숙 file 관리자 2013.02.04 4597
646 음성.음운.형태론연구 3집, 오정란 file 관리자 2013.02.04 4269
645 음성.음운.형태론연구 3집, 이보림 file 관리자 2013.02.04 3279
644 음성.음운.형태론연구 3집, 이봉형 file 관리자 2013.02.04 3556
643 음성.음운.형태론연구 3집, 이상억.이현희 file 관리자 2013.02.04 3361
642 음성.음운.형태론연구 3집, 이용성 file 관리자 2013.02.04 3984
641 음성.음운.형태론연구 3집, 정영희 file 관리자 2013.02.04 3924
640 음성.음운.형태론연구 3집, 정원돈 file 관리자 2013.02.04 3335
639 음성.음운.형태론연구 3집, 초미희.이신숙 file 관리자 2013.02.04 4703
638 음성.음운.형태론연구 3집 목록 관리자 2013.02.04 4324
637 음성.음운.형태론연구 4집, 강덕수 file 관리자 2013.02.05 3381
636 음성.음운.형태론연구 4집, 강옥미 file 관리자 2013.02.05 3266
635 음성.음운.형태론연구 4집, 강용순 file 관리자 2013.02.05 3405
634 음성.음운.형태론연구 4집, Hyunsook Kang file 관리자 2013.02.05 3147
633 음성.음운.형태론연구 4집, Gyung-Ran Kim file 관리자 2013.02.05 4613
632 음성.음운.형태론연구 4집, Won-Bo Kim file 관리자 2013.02.05 4350
631 음성.음운.형태론연구 4집, 김형엽 file 관리자 2013.02.05 4786