]> Kevux Git Server - fll/commit
Progress: UTF-8
authorKevin Day <thekevinday@gmail.com>
Thu, 2 Jul 2020 03:36:33 +0000 (22:36 -0500)
committerKevin Day <thekevinday@gmail.com>
Thu, 2 Jul 2020 03:36:33 +0000 (22:36 -0500)
commitc9c2014c8d37c6c678365ba7853aff73eabad907
tree433ce9738723b46e6b4e751a8e3a7db61d2060a5
parentcb9b887ce0f9ccc0cbdec2f34a2453bb2920c57c
Progress: UTF-8

More UTF-8 improvements.

The Punctuation is complete as far as the "Other" punctuation category is concerned.
(Apparently, there are more groups/sets to do!)

Create a new whitespace functions (is_whitespace_other()) to handle non-whitespace whitespace.
So far, this is only a single character: Ogham space mark ( ).
This Ogham space mark is not a whitespace, it is a graph character that is considered a whitespace.

Add some @todos.

Remove invalid whitespace character().

Add is_digit() vs is_numeric().
The traditional alnum() is referring to alphabet and digit.
With UTF-8 there are non-digit numbers, which can be classified as "numeric".
Therefore, the is_digit() functions are added and intended to be used for the traditional behavior.
The is_numeric() are intended to handle any numeric character.
The is_word() tests are for digits and not for numeric.
level_0/f_fss/c/fss.h
level_0/f_utf/c/private-utf.c
level_0/f_utf/c/private-utf.h
level_0/f_utf/c/utf.c
level_0/f_utf/c/utf.h