단어,word

단어, 낱말, 워드, word

단어들이 모여 구,phrase < 절,clause < 문장,sentence을 이룬다.

단어,word 외 가능한 다른 번역들:
워드,word
{
컴퓨터,computer CPU 컴퓨터구조,computer_architecture ...등등에선 machine_word ? WtEn:machine_word x (2024-01-12) Ggl:machine word
거기선 word의 크기가 레지스터,register esp general_register 의 크기,size와 밀접하며
data 처리의 근본?? 단위 정도.
ALU,arithmetic_logic_unit 에서 처리하는 data의 기본단위사이즈??

WpEn:Word_(computer_architecture) = https://en.wikipedia.org/wiki/Word_(computer_architecture)


근데 좀 보니 word의 쓰임이 '항상 무한한', infinite sequence of characters에 word라는 명칭이 붙는 경우도 있어서, '단-/낱-' 이게 전혀 어울리지 않는 번역인 경우가 있다. 무한길이단어?(단어 자체가 모순) 에 대한 번역?
그냥 신경쓰지 말고 단어로 번역?
or mk 신조어??
그냥 워드로 하는게 최선?




단어가방 ?? bag_of_words ? words_bag ??
{
bag of words

Srch:bag_of_words
}// bag of words ... Ggl:bag of words NN:bag of words

word2vec
{
Srch:word2vec
}


Sub:
예약어,reserved_word =예약어,reserved_word =,reserved_word . 예약어 reserved_word
{
reserved word
예약어

reserved keyword - syn? 키워드,keyword라 해도 syn?

단어,word 워드,word인데, 미리 특수하게 예약된.
PL마다 보통 20-40개 정도 정의된 것 같다. if else goto and while void 등등...

예약어는 그 명백한 이유로 인해 identifier(함수이름 변수이름 레이블이름. .....등등)으로 쓸 수 없다.
거의 대부분 예약어에 뭘 재지정할 수 없다. (static, fixed)
근데 가끔 재지정할 수 있는 PL들이 있다.
장점: 매우 flexible해진다.
단점: 불안정해진다. / 어떤 경우엔 너무 위험해질 듯... 예시나 사례는 모르겠지만 공격도 가능할 듯 (외부에서 서버 스크립트 언어의 keyword를 redefine할 수가 있다면 뭔가 무궁무진한 security hole인데)
예시추가

MKL
이름,name
식별자,identifier
구문,syntax 신택스,syntax





ml,nlp에선 단어,word벡터,vector로 나타냄
그래서 코사인유사도,cosine_similarity 등을 측정

}

MKL
어휘 어휘, =어휘, .... 영어? Ndict:어휘 NdEn:어휘 Ggl:어휘
어휘소,lexeme
thesaurus =,thesaurus =,thesaurus . thesaurus ... WtEn:thesaurus NdEn:thesaurus Ndict:thesaurus Ggl:thesaurus
동의어사전 ???
시소러스,thesaurus 로 일단페이지 mk?
corpus =,corpus =,corpus . corpus ... WtEn:corpus NdEn:corpus Ndict:corpus Ggl:corpus






어떤 alphabet에서 뽑은 $\displaystyle n$ 개 letter의 유한열을 $\displaystyle n-\text{ary}$ word라 한다.
i.e.
어떤 알파벳,alphabet에서 뽑은 $\displaystyle n$레터,letter의 유한열을 $\displaystyle n-\text{ary}$ word라 한다.
i.e.
어떤 알파벳,alphabet에서 뽑은 $\displaystyle n$글자,letter유한수열,finite_sequence$\displaystyle n-\text{ary}$ word라 한다.
}

// tmp from MathWorld:Alphabet
{
letter의 set: alphabet // 레터,letter집합,set = 알파벳,alphabet
letter의 sequence: word // letter의 수열,sequence 시퀀스,sequence = 단어,word 워드,word
words의 set: code // word들의 집합 = 코드,code 부호,code
}

1. Sub

Sub:.... 자연어 natural_language 의 word와, 형식언어,formal_language의 word를 분리하는게 좋을듯? pagename 워드,word로?
ㄴ 완전 분리가 불가능할듯한데...

1.1. 아래 몇개

via MW.
근데 각각 mkl 자유,free? 프리,free?? (참고로 속박bound의 반대말 그쪽 뜻이 아니라, (존재,existence가) 없다는 뜻의 free.) / 제곱,square 세제곱,cube? / 스퀘어,square 큐브,cube ?

1.2. subword


부분단어,subword? 가 최선의 번역?

1.3. square word

square word
tmp see https://mathworld.wolfram.com/SquarefreeWord.html 앞부분
Ggl:square word
///// 위아래 반대개념, mkl

1.4. squarefree word

squarefree word
https://mathworld.wolfram.com/SquarefreeWord.html
subword 중에 square word가 전혀 없는 그런 word.
i.e.
모든 subwords 중에서 square word가 하나도 없는 그런 word가 squarefree word.
...
"squarefree word"
Ggl:squarefree word

1.5. cube word ?

cube word
Ggl:cube word

1.6. cubefree word

cubefree word
cubefree_word =,cubefree_word . cubefree_word


1.7. overlapfree word

overlapfree_word =,overlapfree_word =,overlapfree_word . overlapfree_word
https://mathworld.wolfram.com/OverlapfreeWord.html
Ggl:Overlapfree Word

1.8. Lyndon word

Lyndon_word =,Lyndon_word =,Lyndon_word . Lyndon_word
{
Lyndon word

린든_단어 ?

WtEn:Lyndon_word
수학자 Roger_Lyndon (1954년) called them "standard lexicographic sequences".
뜻: A non-empty string that is strictly smaller in lexicographic_order than all of its rotations.

WpEn:Lyndon_word
= https://en.wikipedia.org/wiki/Lyndon_word





1.9. morphic word / substitutive word

morphic_word =,morphic_word =,morphic_word . morphic_word
{
morphic word
aka substitutive word (wpen)





1.12. tribonacci word

tribonacci word
tribonacci_word =,tribonacci_word =,tribonacci_word . tribonacci_word
{
tribonacci word


"tribonacci word"
Naver:tribonacci word
Ggl:tribonacci word
}

1.13. Sturmian word (or Sturmian sequence or billiard sequence)

Sturmian_word =,Sturmian_word =,Sturmian_word . Sturmian_word
{
Sturmian word
스튀름_단어 ?

Sturmian word, Sturmian sequence, billiard sequence


WpEn:Sturmian_word
= https://en.wikipedia.org/wiki/Sturmian_word
"In mathematics, a Sturmian word (Sturmian sequence or billiard sequence)...."

....
"Sturmian word"
Ggl:Sturmian word
Naver:Sturmian word
} // Sturmian word

1.14. 각종단어여기추가

1.15. 각종단어여기추가

1.16. 각종단어여기추가

1.17. 각종단어여기추가

1.18. 각종단어여기추가

1.19. 각종단어여기추가


2. 문자 중 하나

문자,character 중에서 이름에 word가 들어가는 문자들이나, word와 직간접적 관련된 character들에 대해 나열 예정...

2.1. word joiner

word_joiner =,word_joiner . word_joiner
{
WJ
word joiner
유니코드,Unicode 제어문자,control_character의 하나 - 거기서 line_breaking line_break { link to: https://en.wikipedia.org/wiki/Line_wrap_and_word_wrap corresp ko: https://ko.wikipedia.org/wiki/자동_줄_바꿈 } 하지 말라고 명시하는 용도.

Cmp
zero-width_joiner


3. 자연어에서 단어

natural_language 의 word

3.1. 관련표현/개념들

사전,dictionary
corpus
corpus
코퍼스 말뭉치
WtEn:corpus NN:corpus
meaning
semantics
etymology
etymology
어원
어원학
word의 역사, 기원origin ...을 따지는.
NN:etymology WtEn:etymology

3.2. NLP에서 단어 표현



}


MKLINK
워드,word =워드,word =,word .
{
단어,word - 언어,language에서 말하는 word
워드,word - 컴퓨터,computer 컴퓨터구조,computer_architecture에서 말하는 word







concatenation
- curr string_concatenation. word_concatenation과의 차이점이 있을까? 있다면 무엇?

word의 일반화,generalization는 collation - 정보를 더 구조적 방식으로 으로 present(표현? 제공? ..)하는?[1]






Sub:
well-formed_word =,well-formed_word . well-formed_word
{
well-formed word : a 단어,word in $\displaystyle \mathcal{A}$ (어떤 알파벳,alphabet) admitted by the 형식문법,formal_grammar of some 형식언어,formal_language[2]
}

... so rel. (alternative pagenames?)
낱말,word - 저기엔 국어위주 내용? 혹은 언어,language 언어학,linguistics 자연어,natural_language쪽에만 해당하는 걸 저 page로 분리하면 어떨지.
워드,word - 저건 아마 컴퓨터구조,computer_architectureword를 저쪽으로 옮기기로 거의 결정됨.
워드,Word - 대명사라 capitalize했으나 my wiki system(예정)에서 구분이 안될 확률이 높다... 더 proper pagename은 Microsoft_Word가 아닐지.
----