“Burn” i “Cries” najčešće korišćene reči u heavy metal tekstovima

music wordsNaučnik koji se bavi proučavanjem digitalnih podataka istraživao je koje se reči pojavljuju najčešće a koje najređe u tekstovima metal bendova.

Nekadašnji fizičar, Ian, autor je i sajta Degenerate State, gde objavljuje istraživanja o temama koje ga interesuju. On je pretraživao podatke koji se nalaze na sajtu darklyrics.com na kome se nalazi baza od 222.623 pesme 7.364 benda, sa 22.314 albuma.

Kako Ian objašnjava, ljudi sa engleskog govornog područja izvlače “interesantne” reči pri letimičnom pregledu teksta: “Stičemo utisak o sadržaju dokumenta samim tim što se ističu reči poput: “night” (noć), “pain” (bol) i “death” (smrt). Reč “see” (videti) je takođe vidljiva ali se ne ističe kao reč “hell” (pakao) ili “blood” (krv), kojih ima mnogo manje u tekstovima pesama.”

“Jedan od pristupa mogao bi da bude kako se relativna učestalost reči menja između metal tekstova i engleskog jezika uopšte. Da bismo ovo odredili, neophodno je definisati kako “standardni” engleski izgleda. Za procesuiranje teksta ja koristim NLTK (Natural Language Toolkit) koji je lak za poređenje sa “braon korpusom” – zbirkom dokumenata objavljenom 1961. godine, a koja pokriva čitav niz različitih žanrova (bez tekstova pesama).”, pojasnio je Ian metod koji je korišćen u ovom istraživanju.

Nakon nekoliko matematičkih jednačina sa definisanim parametrima, izračunato je koje reči se najčešće pojavljuju u metal tekstovima a koje najređe.

Najčešće reči u metal tekstovima:

  1. burn – 3.81
  2. cries – 3.63
  3. veins – 3.59
  4. eternity – 3.56
  5. breathe – 3.54
  6. beast – 3.54
  7. gonna  – 3.53
  8. demons  – 3.53
  9. ashes  – 3.51
  10. soul – 3.40
  11. sorrow  – 3.40
  12. sword – 3.38
  13. goodbye – 3.28
  14. dreams  – 3.28
  15. gods  – 3.24
  16. pray  – 3.22
  17. reign  – 3.15
  18.  tear  – 3.12
  19.  flames  – 3.12
  20. scream  – 3.11

Najređe reči u metal tekstovima:

  1. particularly – 6.47
  2. indicated – 6.32
  3. secretary – 6.29
  4. committee – 6.16
  5. university – 6.09
  6. relatively – 6.08
  7. noted – 5.85
  8. approximately – 5.75
  9. chairman – 5.69
  10. employees – 5.67
  11. attorney – 5.66
  12. membership – 5.64
  13. administrative – 5.61
  14.  considerable – 5.60
  15. academic – 5.51
  16. literary – 5.49
  17. agencies – 5.48
  18. measurements – 5.47
  19. fiscal – 5.45
  20. residential – 5.45

Save

Ostavite komentar: