xref: /aoo4110/main/sal/textenc/textenc.cxx (revision b1cdbd2c)
1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski // MARKER(update_precomp.py): autogen include statement, do not remove
25*b1cdbd2cSJim Jagielski #include "precompiled_sal.hxx"
26*b1cdbd2cSJim Jagielski 
27*b1cdbd2cSJim Jagielski /* TODO! This file should not be called textenc.c, because it is not the
28*b1cdbd2cSJim Jagielski    implementation of rtl/textenc.h.  Rather, it should be called
29*b1cdbd2cSJim Jagielski    gettextencodingdata.c. */
30*b1cdbd2cSJim Jagielski #include "gettextencodingdata.h"
31*b1cdbd2cSJim Jagielski #include "tenchelp.h"
32*b1cdbd2cSJim Jagielski #include "rtl/textenc.h"
33*b1cdbd2cSJim Jagielski 
34*b1cdbd2cSJim Jagielski #ifndef INCLUDED_STDDEF_H
35*b1cdbd2cSJim Jagielski #include <stddef.h>
36*b1cdbd2cSJim Jagielski #define INCLUDED_STDDEF_H
37*b1cdbd2cSJim Jagielski #endif
38*b1cdbd2cSJim Jagielski 
39*b1cdbd2cSJim Jagielski #define NOTABUNI_START 0xFF
40*b1cdbd2cSJim Jagielski #define NOTABUNI_END 0x00
41*b1cdbd2cSJim Jagielski 
42*b1cdbd2cSJim Jagielski #define NOTABCHAR_START 0xFFFF
43*b1cdbd2cSJim Jagielski #define NOTABCHAR_END 0x0000
44*b1cdbd2cSJim Jagielski 
45*b1cdbd2cSJim Jagielski #define SAME8090UNI_START 0x80
46*b1cdbd2cSJim Jagielski #define SAME8090UNI_END 0x9F
47*b1cdbd2cSJim Jagielski static sal_uInt16 const aImpl8090SameToUniTab[SAME8090UNI_END
48*b1cdbd2cSJim Jagielski                                                   - SAME8090UNI_START
49*b1cdbd2cSJim Jagielski                                                   + 1]
50*b1cdbd2cSJim Jagielski = { 0x0080, 0x0081, 0x0082, 0x0083, 0x0084, 0x0085, 0x0086, 0x0087, /* 0x80 */
51*b1cdbd2cSJim Jagielski     0x0088, 0x0089, 0x008A, 0x008B, 0x008C, 0x008D, 0x008E, 0x008F,
52*b1cdbd2cSJim Jagielski     0x0090, 0x0091, 0x0092, 0x0093, 0x0094, 0x0095, 0x0096, 0x0097, /* 0x90 */
53*b1cdbd2cSJim Jagielski     0x0098, 0x0099, 0x009A, 0x009B, 0x009C, 0x009D, 0x009E, 0x009F };
54*b1cdbd2cSJim Jagielski 
55*b1cdbd2cSJim Jagielski #define SAME8090CHAR_START 0x0080
56*b1cdbd2cSJim Jagielski #define SAME8090CHAR_END 0x009F
57*b1cdbd2cSJim Jagielski static sal_uChar const aImpl8090SameToCharTab[SAME8090CHAR_END
58*b1cdbd2cSJim Jagielski                                                   - SAME8090CHAR_START
59*b1cdbd2cSJim Jagielski                                                   + 1]
60*b1cdbd2cSJim Jagielski     = { 0x80, 0x81, 0x82, 0x83, 0x84, 0x85, 0x86, 0x87, /* 0x0080 */
61*b1cdbd2cSJim Jagielski         0x88, 0x89, 0x8A, 0x8B, 0x8C, 0x8D, 0x8E, 0x8F,
62*b1cdbd2cSJim Jagielski         0x90, 0x91, 0x92, 0x93, 0x94, 0x95, 0x96, 0x97, /* 0x0090 */
63*b1cdbd2cSJim Jagielski         0x98, 0x99, 0x9A, 0x9B, 0x9C, 0x9D, 0x9E, 0x9F };
64*b1cdbd2cSJim Jagielski 
65*b1cdbd2cSJim Jagielski #define SAMEA0FFCHAR_START 0x00A0
66*b1cdbd2cSJim Jagielski #define SAMEA0FFCHAR_END 0x00FF
67*b1cdbd2cSJim Jagielski static sal_uChar const aImplA0FFSameToCharTab[SAMEA0FFCHAR_END
68*b1cdbd2cSJim Jagielski                                                   - SAMEA0FFCHAR_START
69*b1cdbd2cSJim Jagielski                                                   + 1]
70*b1cdbd2cSJim Jagielski     = { 0xA0, 0xA1, 0xA2, 0xA3, 0xA4, 0xA5, 0xA6, 0xA7, /* 0x00A0 */
71*b1cdbd2cSJim Jagielski         0xA8, 0xA9, 0xAA, 0xAB, 0xAC, 0xAD, 0xAE, 0xAF,
72*b1cdbd2cSJim Jagielski         0xB0, 0xB1, 0xB2, 0xB3, 0xB4, 0xB5, 0xB6, 0xB7, /* 0x00B0 */
73*b1cdbd2cSJim Jagielski         0xB8, 0xB9, 0xBA, 0xBB, 0xBC, 0xBD, 0xBE, 0xBF,
74*b1cdbd2cSJim Jagielski         0xC0, 0xC1, 0xC2, 0xC3, 0xC4, 0xC5, 0xC6, 0xC7, /* 0x00C0 */
75*b1cdbd2cSJim Jagielski         0xC8, 0xC9, 0xCA, 0xCB, 0xCC, 0xCD, 0xCE, 0xCF,
76*b1cdbd2cSJim Jagielski         0xD0, 0xD1, 0xD2, 0xD3, 0xD4, 0xD5, 0xD6, 0xD7, /* 0x00D0 */
77*b1cdbd2cSJim Jagielski         0xD8, 0xD9, 0xDA, 0xDB, 0xDC, 0xDD, 0xDE, 0xDF,
78*b1cdbd2cSJim Jagielski         0xE0, 0xE1, 0xE2, 0xE3, 0xE4, 0xE5, 0xE6, 0xE7, /* 0x00E0 */
79*b1cdbd2cSJim Jagielski         0xE8, 0xE9, 0xEA, 0xEB, 0xEC, 0xED, 0xEE, 0xEF,
80*b1cdbd2cSJim Jagielski         0xF0, 0xF1, 0xF2, 0xF3, 0xF4, 0xF5, 0xF6, 0xF7, /* 0x00F0 */
81*b1cdbd2cSJim Jagielski         0xF8, 0xF9, 0xFA, 0xFB, 0xFC, 0xFD, 0xFE, 0xFF };
82*b1cdbd2cSJim Jagielski 
83*b1cdbd2cSJim Jagielski static sal_uInt16 const aImplDoubleByteIdentifierTab[1] = { 0 };
84*b1cdbd2cSJim Jagielski 
85*b1cdbd2cSJim Jagielski #include "tcvtarb1.tab"
86*b1cdbd2cSJim Jagielski #include "tcvteas1.tab"
87*b1cdbd2cSJim Jagielski #include "tcvtest1.tab"
88*b1cdbd2cSJim Jagielski #include "tcvtjp1.tab"
89*b1cdbd2cSJim Jagielski #include "tcvtjp2.tab"
90*b1cdbd2cSJim Jagielski #include "tcvtjp3.tab"
91*b1cdbd2cSJim Jagielski #include "tcvtjp4.tab"
92*b1cdbd2cSJim Jagielski #include "tcvtjp5.tab"
93*b1cdbd2cSJim Jagielski #include "tcvtjp6.tab"
94*b1cdbd2cSJim Jagielski #include "tcvtkr1.tab"
95*b1cdbd2cSJim Jagielski #include "tcvtkr2.tab"
96*b1cdbd2cSJim Jagielski #include "tcvtkr4.tab"
97*b1cdbd2cSJim Jagielski #include "tcvtkr5.tab"
98*b1cdbd2cSJim Jagielski #include "tcvtkr6.tab"
99*b1cdbd2cSJim Jagielski #include "tcvtlat1.tab"
100*b1cdbd2cSJim Jagielski #include "tcvtscn1.tab"
101*b1cdbd2cSJim Jagielski #include "tcvtscn2.tab"
102*b1cdbd2cSJim Jagielski #include "tcvtscn3.tab"
103*b1cdbd2cSJim Jagielski #include "tcvtscn4.tab"
104*b1cdbd2cSJim Jagielski #include "tcvtscn5.tab"
105*b1cdbd2cSJim Jagielski #include "tcvtscn6.tab"
106*b1cdbd2cSJim Jagielski #include "tcvtsym1.tab"
107*b1cdbd2cSJim Jagielski #include "tcvttcn1.tab"
108*b1cdbd2cSJim Jagielski #include "tcvttcn2.tab"
109*b1cdbd2cSJim Jagielski #include "tcvttcn6.tab"
110*b1cdbd2cSJim Jagielski #include "tcvtuni1.tab"
111*b1cdbd2cSJim Jagielski 
112*b1cdbd2cSJim Jagielski #include "convertbig5hkscs.tab"
113*b1cdbd2cSJim Jagielski #include "converteuctw.tab"
114*b1cdbd2cSJim Jagielski #include "convertgb18030.tab"
115*b1cdbd2cSJim Jagielski #include "convertiso2022cn.tab"
116*b1cdbd2cSJim Jagielski #include "convertiso2022jp.tab"
117*b1cdbd2cSJim Jagielski #include "convertiso2022kr.tab"
118*b1cdbd2cSJim Jagielski #include "convertadobe.tab"
119*b1cdbd2cSJim Jagielski 
120*b1cdbd2cSJim Jagielski ImplTextEncodingData const *
Impl_getTextEncodingData(rtl_TextEncoding nEncoding)121*b1cdbd2cSJim Jagielski Impl_getTextEncodingData(rtl_TextEncoding nEncoding) SAL_THROW_EXTERN_C()
122*b1cdbd2cSJim Jagielski {
123*b1cdbd2cSJim Jagielski     static ImplTextEncodingData const * const aData[]
124*b1cdbd2cSJim Jagielski         = { NULL, /* DONTKNOW */
125*b1cdbd2cSJim Jagielski             &aImplMS1252TextEncodingData, /* MS_1252 */
126*b1cdbd2cSJim Jagielski             &aImplAPPLEROMANTextEncodingData, /* APPLE_ROMAN */
127*b1cdbd2cSJim Jagielski             &aImplIBM437TextEncodingData, /* IBM_437 */
128*b1cdbd2cSJim Jagielski             &aImplIBM850TextEncodingData, /* IBM_850 */
129*b1cdbd2cSJim Jagielski             &aImplIBM860TextEncodingData, /* IBM_860 */
130*b1cdbd2cSJim Jagielski             &aImplIBM861TextEncodingData, /* IBM_861 */
131*b1cdbd2cSJim Jagielski             &aImplIBM863TextEncodingData, /* IBM_863 */
132*b1cdbd2cSJim Jagielski             &aImplIBM865TextEncodingData, /* IBM_865 */
133*b1cdbd2cSJim Jagielski             NULL, /* reserved (SYSTEM) */
134*b1cdbd2cSJim Jagielski             &aImplSYMBOLTextEncodingData, /* SYMBOL */
135*b1cdbd2cSJim Jagielski             &aImplUSASCIITextEncodingData, /* ASCII_US */
136*b1cdbd2cSJim Jagielski             &aImplISO88591TextEncodingData, /* ISO_8859_1 */
137*b1cdbd2cSJim Jagielski             &aImplISO88592TextEncodingData, /* ISO_8859_2 */
138*b1cdbd2cSJim Jagielski             &aImplISO88593TextEncodingData, /* ISO_8859_3 */
139*b1cdbd2cSJim Jagielski             &aImplISO88594TextEncodingData, /* ISO_8859_4 */
140*b1cdbd2cSJim Jagielski             &aImplISO88595TextEncodingData, /* ISO_8859_5 */
141*b1cdbd2cSJim Jagielski             &aImplISO88596TextEncodingData, /* ISO_8859_6 */
142*b1cdbd2cSJim Jagielski             &aImplISO88597TextEncodingData, /* ISO_8859_7 */
143*b1cdbd2cSJim Jagielski             &aImplISO88598TextEncodingData, /* ISO_8859_8 */
144*b1cdbd2cSJim Jagielski             &aImplISO88599TextEncodingData, /* ISO_8859_9 */
145*b1cdbd2cSJim Jagielski             &aImplISO885914TextEncodingData, /* ISO_8859_14 */
146*b1cdbd2cSJim Jagielski             &aImplISO885915TextEncodingData, /* ISO_8859_15 */
147*b1cdbd2cSJim Jagielski             &aImplIBM737TextEncodingData, /* IBM_737 */
148*b1cdbd2cSJim Jagielski             &aImplIBM775TextEncodingData, /* IBM_775 */
149*b1cdbd2cSJim Jagielski             &aImplIBM852TextEncodingData, /* IBM_852 */
150*b1cdbd2cSJim Jagielski             &aImplIBM855TextEncodingData, /* IBM_855 */
151*b1cdbd2cSJim Jagielski             &aImplIBM857TextEncodingData, /* IBM_857 */
152*b1cdbd2cSJim Jagielski             &aImplIBM862TextEncodingData, /* IBM_862 */
153*b1cdbd2cSJim Jagielski             &aImplIBM864TextEncodingData, /* IBM_864 */
154*b1cdbd2cSJim Jagielski             &aImplIBM866TextEncodingData, /* IBM_866 */
155*b1cdbd2cSJim Jagielski             &aImplIBM869TextEncodingData, /* IBM_869 */
156*b1cdbd2cSJim Jagielski             &aImplMS874TextEncodingData, /* MS_874 */
157*b1cdbd2cSJim Jagielski             &aImplMS1250TextEncodingData, /* MS_1250 */
158*b1cdbd2cSJim Jagielski             &aImplMS1251TextEncodingData, /* MS_1251 */
159*b1cdbd2cSJim Jagielski             &aImplMS1253TextEncodingData, /* MS_1253 */
160*b1cdbd2cSJim Jagielski             &aImplMS1254TextEncodingData, /* MS_1254 */
161*b1cdbd2cSJim Jagielski             &aImplMS1255TextEncodingData, /* MS_1255 */
162*b1cdbd2cSJim Jagielski             &aImplMS1256TextEncodingData, /* MS_1256 */
163*b1cdbd2cSJim Jagielski             &aImplMS1257TextEncodingData, /* MS_1257 */
164*b1cdbd2cSJim Jagielski             &aImplMS1258TextEncodingData, /* MS_1258 */
165*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_ARABIC */
166*b1cdbd2cSJim Jagielski             &aImplAPPLECENTEUROTextEncodingData, /* APPLE_CENTEURO */
167*b1cdbd2cSJim Jagielski             &aImplAPPLECROATIANTextEncodingData, /* APPLE_CROATIAN */
168*b1cdbd2cSJim Jagielski             &aImplAPPLECYRILLICTextEncodingData, /* APPLE_CYRILLIC */
169*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_DEVANAGARI */
170*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_FARSI */
171*b1cdbd2cSJim Jagielski             &aImplAPPLEGREEKTextEncodingData, /* APPLE_GREEK */
172*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_GUJARATI */
173*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_GURMUKHI */
174*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_HEBREW */
175*b1cdbd2cSJim Jagielski             &aImplAPPLEICELANDTextEncodingData, /* APPLE_ICELAND */
176*b1cdbd2cSJim Jagielski             &aImplAPPLEROMANIANTextEncodingData, /* APPLE_ROMANIAN */
177*b1cdbd2cSJim Jagielski             NULL, /* TODO! APPLE_THAI */
178*b1cdbd2cSJim Jagielski             &aImplAPPLETURKISHTextEncodingData, /* APPLE_TURKISH */
179*b1cdbd2cSJim Jagielski             &aImplAPPLEUKRAINIANTextEncodingData, /* APPLE_UKRAINIAN */
180*b1cdbd2cSJim Jagielski             &aImplAPPLECHINSIMPTextEncodingData, /* APPLE_CHINSIMP */
181*b1cdbd2cSJim Jagielski             &aImplAPPLECHINTRADTextEncodingData, /* APPLE_CHINTRAD */
182*b1cdbd2cSJim Jagielski             &aImplAPPLEJAPANESETextEncodingData, /* APPLE_JAPANESE */
183*b1cdbd2cSJim Jagielski             &aImplAPPLEKOREANTextEncodingData, /* APPLE_KOREAN */
184*b1cdbd2cSJim Jagielski             &aImplMS932TextEncodingData, /* MS_932 */
185*b1cdbd2cSJim Jagielski             &aImplMS936TextEncodingData, /* MS_936 */
186*b1cdbd2cSJim Jagielski             &aImplMS949TextEncodingData, /* MS_949 */
187*b1cdbd2cSJim Jagielski             &aImplMS950TextEncodingData, /* MS_950 */
188*b1cdbd2cSJim Jagielski             &aImplSJISTextEncodingData, /* SHIFT_JIS */
189*b1cdbd2cSJim Jagielski             &aImplGB2312TextEncodingData, /* GB_2312 */
190*b1cdbd2cSJim Jagielski             &aImplGBT12345TextEncodingData, /* GBT_12345 */
191*b1cdbd2cSJim Jagielski             &aImplGBKTextEncodingData, /* GBK */
192*b1cdbd2cSJim Jagielski             &aImplBIG5TextEncodingData, /* BIG5 */
193*b1cdbd2cSJim Jagielski             &aImplEUCJPTextEncodingData, /* EUC_JP */
194*b1cdbd2cSJim Jagielski             &aImplEUCCNTextEncodingData, /* EUC_CN */
195*b1cdbd2cSJim Jagielski             &aImplEucTwTextEncodingData, /* EUC_TW */
196*b1cdbd2cSJim Jagielski             &aImplIso2022JpTextEncodingData, /* ISO_2022_JP */
197*b1cdbd2cSJim Jagielski             &aImplIso2022CnTextEncodingData, /* ISO_2022_CN */
198*b1cdbd2cSJim Jagielski             &aImplKOI8RTextEncodingData, /* KOI8_R */
199*b1cdbd2cSJim Jagielski             &aImplUTF7TextEncodingData, /* UTF7 */
200*b1cdbd2cSJim Jagielski             &aImplUTF8TextEncodingData, /* UTF8 */
201*b1cdbd2cSJim Jagielski             &aImplISO885910TextEncodingData, /* ISO_8859_10 */
202*b1cdbd2cSJim Jagielski             &aImplISO885913TextEncodingData, /* ISO_8859_13 */
203*b1cdbd2cSJim Jagielski             &aImplEUCKRTextEncodingData, /* EUC_KR */
204*b1cdbd2cSJim Jagielski             &aImplIso2022KrTextEncodingData, /* ISO_2022_KR */
205*b1cdbd2cSJim Jagielski             &aImplJISX0201TextEncodingData, /* JIS_X_0201 */
206*b1cdbd2cSJim Jagielski             &aImplJISX0208TextEncodingData, /* JIS_X_0208 */
207*b1cdbd2cSJim Jagielski             &aImplJISX0212TextEncodingData, /* JIS_X_0212 */
208*b1cdbd2cSJim Jagielski             &aImplMS1361TextEncodingData, /* MS_1361 */
209*b1cdbd2cSJim Jagielski             &aImplGb18030TextEncodingData, /* GB_18030 */
210*b1cdbd2cSJim Jagielski             &aImplBig5HkscsTextEncodingData, /* BIG5_HKSCS */
211*b1cdbd2cSJim Jagielski             &aImplTis620TextEncodingData, /* TIS_620 */
212*b1cdbd2cSJim Jagielski             &aImplKoi8UTextEncodingData, /* KOI8_U */
213*b1cdbd2cSJim Jagielski             &aImplJavaUtf8TextEncodingData, /* JAVA_UTF8 */
214*b1cdbd2cSJim Jagielski             &adobeStandardEncodingData, /* ADOBE_STANDARD */
215*b1cdbd2cSJim Jagielski             &adobeSymbolEncodingData, /* ADOBE_SYMBOL */
216*b1cdbd2cSJim Jagielski             &aImplPT154TextEncodingData, /* PT154 */
217*b1cdbd2cSJim Jagielski             &adobeDingbatsEncodingData }; /* ADOBE_DINGBATS */
218*b1cdbd2cSJim Jagielski     return
219*b1cdbd2cSJim Jagielski         nEncoding < sizeof aData / sizeof aData[0] ? aData[nEncoding] : NULL;
220*b1cdbd2cSJim Jagielski }
221