xref: /aoo4110/main/sal/textenc/textcvt.c (revision b1cdbd2c)
1*b1cdbd2cSJim Jagielski /**************************************************************
2*b1cdbd2cSJim Jagielski  *
3*b1cdbd2cSJim Jagielski  * Licensed to the Apache Software Foundation (ASF) under one
4*b1cdbd2cSJim Jagielski  * or more contributor license agreements.  See the NOTICE file
5*b1cdbd2cSJim Jagielski  * distributed with this work for additional information
6*b1cdbd2cSJim Jagielski  * regarding copyright ownership.  The ASF licenses this file
7*b1cdbd2cSJim Jagielski  * to you under the Apache License, Version 2.0 (the
8*b1cdbd2cSJim Jagielski  * "License"); you may not use this file except in compliance
9*b1cdbd2cSJim Jagielski  * with the License.  You may obtain a copy of the License at
10*b1cdbd2cSJim Jagielski  *
11*b1cdbd2cSJim Jagielski  *   http://www.apache.org/licenses/LICENSE-2.0
12*b1cdbd2cSJim Jagielski  *
13*b1cdbd2cSJim Jagielski  * Unless required by applicable law or agreed to in writing,
14*b1cdbd2cSJim Jagielski  * software distributed under the License is distributed on an
15*b1cdbd2cSJim Jagielski  * "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
16*b1cdbd2cSJim Jagielski  * KIND, either express or implied.  See the License for the
17*b1cdbd2cSJim Jagielski  * specific language governing permissions and limitations
18*b1cdbd2cSJim Jagielski  * under the License.
19*b1cdbd2cSJim Jagielski  *
20*b1cdbd2cSJim Jagielski  *************************************************************/
21*b1cdbd2cSJim Jagielski 
22*b1cdbd2cSJim Jagielski 
23*b1cdbd2cSJim Jagielski 
24*b1cdbd2cSJim Jagielski #include "rtl/textcvt.h"
25*b1cdbd2cSJim Jagielski #include "gettextencodingdata.h"
26*b1cdbd2cSJim Jagielski #include "tenchelp.h"
27*b1cdbd2cSJim Jagielski 
28*b1cdbd2cSJim Jagielski /* ======================================================================= */
29*b1cdbd2cSJim Jagielski 
ImplDummyToUnicode(const sal_Char * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)30*b1cdbd2cSJim Jagielski static sal_Size ImplDummyToUnicode( const sal_Char* pSrcBuf, sal_Size nSrcBytes,
31*b1cdbd2cSJim Jagielski                                     sal_Unicode* pDestBuf, sal_Size nDestChars,
32*b1cdbd2cSJim Jagielski                                     sal_uInt32 nFlags, sal_uInt32* pInfo,
33*b1cdbd2cSJim Jagielski                                     sal_Size* pSrcCvtBytes )
34*b1cdbd2cSJim Jagielski {
35*b1cdbd2cSJim Jagielski     sal_Unicode*        pEndDestBuf;
36*b1cdbd2cSJim Jagielski     const sal_Char*     pEndSrcBuf;
37*b1cdbd2cSJim Jagielski 
38*b1cdbd2cSJim Jagielski     if ( ((nFlags & RTL_TEXTTOUNICODE_FLAGS_UNDEFINED_MASK) == RTL_TEXTTOUNICODE_FLAGS_UNDEFINED_ERROR) ||
39*b1cdbd2cSJim Jagielski          ((nFlags & RTL_TEXTTOUNICODE_FLAGS_MBUNDEFINED_MASK) == RTL_TEXTTOUNICODE_FLAGS_MBUNDEFINED_ERROR) )
40*b1cdbd2cSJim Jagielski     {
41*b1cdbd2cSJim Jagielski         *pInfo |= RTL_TEXTTOUNICODE_INFO_ERROR |
42*b1cdbd2cSJim Jagielski                   RTL_TEXTTOUNICODE_INFO_UNDEFINED |
43*b1cdbd2cSJim Jagielski                   RTL_TEXTTOUNICODE_INFO_MBUNDEFINED;
44*b1cdbd2cSJim Jagielski         return 0;
45*b1cdbd2cSJim Jagielski     }
46*b1cdbd2cSJim Jagielski 
47*b1cdbd2cSJim Jagielski     *pInfo = 0;
48*b1cdbd2cSJim Jagielski     pEndDestBuf = pDestBuf+nDestChars;
49*b1cdbd2cSJim Jagielski     pEndSrcBuf  = pSrcBuf+nSrcBytes;
50*b1cdbd2cSJim Jagielski     while ( pSrcBuf < pEndSrcBuf )
51*b1cdbd2cSJim Jagielski     {
52*b1cdbd2cSJim Jagielski         if ( pDestBuf == pEndDestBuf )
53*b1cdbd2cSJim Jagielski         {
54*b1cdbd2cSJim Jagielski             *pInfo |= RTL_TEXTTOUNICODE_INFO_ERROR | RTL_TEXTTOUNICODE_INFO_DESTBUFFERTOSMALL;
55*b1cdbd2cSJim Jagielski             break;
56*b1cdbd2cSJim Jagielski         }
57*b1cdbd2cSJim Jagielski 
58*b1cdbd2cSJim Jagielski         *pDestBuf = (sal_Unicode)(sal_uChar)*pSrcBuf;
59*b1cdbd2cSJim Jagielski         pDestBuf++;
60*b1cdbd2cSJim Jagielski         pSrcBuf++;
61*b1cdbd2cSJim Jagielski     }
62*b1cdbd2cSJim Jagielski 
63*b1cdbd2cSJim Jagielski     *pSrcCvtBytes = nSrcBytes - (pEndSrcBuf-pSrcBuf);
64*b1cdbd2cSJim Jagielski     return (nDestChars - (pEndDestBuf-pDestBuf));
65*b1cdbd2cSJim Jagielski }
66*b1cdbd2cSJim Jagielski 
67*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
68*b1cdbd2cSJim Jagielski 
ImplUnicodeToDummy(const sal_Unicode * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)69*b1cdbd2cSJim Jagielski static sal_Size ImplUnicodeToDummy( const sal_Unicode* pSrcBuf, sal_Size nSrcChars,
70*b1cdbd2cSJim Jagielski                                     sal_Char* pDestBuf, sal_Size nDestBytes,
71*b1cdbd2cSJim Jagielski                                     sal_uInt32 nFlags, sal_uInt32* pInfo,
72*b1cdbd2cSJim Jagielski                                     sal_Size* pSrcCvtChars )
73*b1cdbd2cSJim Jagielski {
74*b1cdbd2cSJim Jagielski     sal_Char*               pEndDestBuf;
75*b1cdbd2cSJim Jagielski     const sal_Unicode*      pEndSrcBuf;
76*b1cdbd2cSJim Jagielski 
77*b1cdbd2cSJim Jagielski     if ( ((nFlags & RTL_UNICODETOTEXT_FLAGS_UNDEFINED_MASK) == RTL_UNICODETOTEXT_FLAGS_UNDEFINED_ERROR) )
78*b1cdbd2cSJim Jagielski     {
79*b1cdbd2cSJim Jagielski         *pInfo |= RTL_UNICODETOTEXT_INFO_ERROR |
80*b1cdbd2cSJim Jagielski                   RTL_UNICODETOTEXT_INFO_UNDEFINED;
81*b1cdbd2cSJim Jagielski         return 0;
82*b1cdbd2cSJim Jagielski     }
83*b1cdbd2cSJim Jagielski 
84*b1cdbd2cSJim Jagielski     *pInfo = 0;
85*b1cdbd2cSJim Jagielski     pEndDestBuf = pDestBuf+nDestBytes;
86*b1cdbd2cSJim Jagielski     pEndSrcBuf  = pSrcBuf+nSrcChars;
87*b1cdbd2cSJim Jagielski     while ( pSrcBuf < pEndSrcBuf )
88*b1cdbd2cSJim Jagielski     {
89*b1cdbd2cSJim Jagielski         if ( pDestBuf == pEndDestBuf )
90*b1cdbd2cSJim Jagielski         {
91*b1cdbd2cSJim Jagielski             *pInfo |= RTL_UNICODETOTEXT_INFO_ERROR | RTL_UNICODETOTEXT_INFO_DESTBUFFERTOSMALL;
92*b1cdbd2cSJim Jagielski             break;
93*b1cdbd2cSJim Jagielski         }
94*b1cdbd2cSJim Jagielski 
95*b1cdbd2cSJim Jagielski         *pDestBuf = (sal_Char)(sal_uChar)(*pSrcBuf & 0x00FF);
96*b1cdbd2cSJim Jagielski         pDestBuf++;
97*b1cdbd2cSJim Jagielski         pSrcBuf++;
98*b1cdbd2cSJim Jagielski     }
99*b1cdbd2cSJim Jagielski 
100*b1cdbd2cSJim Jagielski     *pSrcCvtChars = nSrcChars - (pEndSrcBuf-pSrcBuf);
101*b1cdbd2cSJim Jagielski     return (nDestBytes - (pEndDestBuf-pDestBuf));
102*b1cdbd2cSJim Jagielski }
103*b1cdbd2cSJim Jagielski 
104*b1cdbd2cSJim Jagielski /* ======================================================================= */
105*b1cdbd2cSJim Jagielski 
rtl_createTextToUnicodeConverter(rtl_TextEncoding eTextEncoding)106*b1cdbd2cSJim Jagielski rtl_TextToUnicodeConverter SAL_CALL rtl_createTextToUnicodeConverter( rtl_TextEncoding eTextEncoding )
107*b1cdbd2cSJim Jagielski {
108*b1cdbd2cSJim Jagielski     const ImplTextEncodingData* pData = Impl_getTextEncodingData( eTextEncoding );
109*b1cdbd2cSJim Jagielski     if ( pData )
110*b1cdbd2cSJim Jagielski         return (rtl_TextToUnicodeConverter) &pData->maConverter;
111*b1cdbd2cSJim Jagielski     else
112*b1cdbd2cSJim Jagielski         return 0;
113*b1cdbd2cSJim Jagielski }
114*b1cdbd2cSJim Jagielski 
115*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
116*b1cdbd2cSJim Jagielski 
rtl_destroyTextToUnicodeConverter(rtl_TextToUnicodeConverter hContext)117*b1cdbd2cSJim Jagielski void SAL_CALL rtl_destroyTextToUnicodeConverter( rtl_TextToUnicodeConverter hContext )
118*b1cdbd2cSJim Jagielski {
119*b1cdbd2cSJim Jagielski     (void) hContext; /* unused */
120*b1cdbd2cSJim Jagielski }
121*b1cdbd2cSJim Jagielski 
122*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
123*b1cdbd2cSJim Jagielski 
rtl_createTextToUnicodeContext(rtl_TextToUnicodeConverter hConverter)124*b1cdbd2cSJim Jagielski rtl_TextToUnicodeContext SAL_CALL rtl_createTextToUnicodeContext( rtl_TextToUnicodeConverter hConverter )
125*b1cdbd2cSJim Jagielski {
126*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
127*b1cdbd2cSJim Jagielski     if ( !pConverter )
128*b1cdbd2cSJim Jagielski         return 0;
129*b1cdbd2cSJim Jagielski     else if ( pConverter->mpCreateTextToUnicodeContext )
130*b1cdbd2cSJim Jagielski         return (rtl_TextToUnicodeContext)pConverter->mpCreateTextToUnicodeContext();
131*b1cdbd2cSJim Jagielski     else
132*b1cdbd2cSJim Jagielski         return (rtl_TextToUnicodeContext)1;
133*b1cdbd2cSJim Jagielski }
134*b1cdbd2cSJim Jagielski 
135*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
136*b1cdbd2cSJim Jagielski 
rtl_destroyTextToUnicodeContext(rtl_TextToUnicodeConverter hConverter,rtl_TextToUnicodeContext hContext)137*b1cdbd2cSJim Jagielski void SAL_CALL rtl_destroyTextToUnicodeContext( rtl_TextToUnicodeConverter hConverter,
138*b1cdbd2cSJim Jagielski                                                rtl_TextToUnicodeContext hContext )
139*b1cdbd2cSJim Jagielski {
140*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
141*b1cdbd2cSJim Jagielski     if ( pConverter && hContext && pConverter->mpDestroyTextToUnicodeContext )
142*b1cdbd2cSJim Jagielski         pConverter->mpDestroyTextToUnicodeContext( (void*)hContext );
143*b1cdbd2cSJim Jagielski }
144*b1cdbd2cSJim Jagielski 
145*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
146*b1cdbd2cSJim Jagielski 
rtl_resetTextToUnicodeContext(rtl_TextToUnicodeConverter hConverter,rtl_TextToUnicodeContext hContext)147*b1cdbd2cSJim Jagielski void SAL_CALL rtl_resetTextToUnicodeContext( rtl_TextToUnicodeConverter hConverter,
148*b1cdbd2cSJim Jagielski                                              rtl_TextToUnicodeContext hContext )
149*b1cdbd2cSJim Jagielski {
150*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
151*b1cdbd2cSJim Jagielski     if ( pConverter && hContext && pConverter->mpResetTextToUnicodeContext )
152*b1cdbd2cSJim Jagielski         pConverter->mpResetTextToUnicodeContext( (void*)hContext );
153*b1cdbd2cSJim Jagielski }
154*b1cdbd2cSJim Jagielski 
155*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
156*b1cdbd2cSJim Jagielski 
rtl_convertTextToUnicode(rtl_TextToUnicodeConverter hConverter,rtl_TextToUnicodeContext hContext,const sal_Char * pSrcBuf,sal_Size nSrcBytes,sal_Unicode * pDestBuf,sal_Size nDestChars,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtBytes)157*b1cdbd2cSJim Jagielski sal_Size SAL_CALL rtl_convertTextToUnicode( rtl_TextToUnicodeConverter hConverter,
158*b1cdbd2cSJim Jagielski                                             rtl_TextToUnicodeContext hContext,
159*b1cdbd2cSJim Jagielski                                             const sal_Char* pSrcBuf, sal_Size nSrcBytes,
160*b1cdbd2cSJim Jagielski                                             sal_Unicode* pDestBuf, sal_Size nDestChars,
161*b1cdbd2cSJim Jagielski                                             sal_uInt32 nFlags, sal_uInt32* pInfo,
162*b1cdbd2cSJim Jagielski                                             sal_Size* pSrcCvtBytes )
163*b1cdbd2cSJim Jagielski {
164*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
165*b1cdbd2cSJim Jagielski 
166*b1cdbd2cSJim Jagielski     /* Only temporaer, because we don't want die, if we don't have a
167*b1cdbd2cSJim Jagielski        converter, because not all converters are implemented yet */
168*b1cdbd2cSJim Jagielski     if ( !pConverter )
169*b1cdbd2cSJim Jagielski     {
170*b1cdbd2cSJim Jagielski         return ImplDummyToUnicode( pSrcBuf, nSrcBytes,
171*b1cdbd2cSJim Jagielski                                    pDestBuf, nDestChars,
172*b1cdbd2cSJim Jagielski                                    nFlags, pInfo, pSrcCvtBytes );
173*b1cdbd2cSJim Jagielski     }
174*b1cdbd2cSJim Jagielski 
175*b1cdbd2cSJim Jagielski     return pConverter->mpConvertTextToUnicodeProc( pConverter->mpConvertData,
176*b1cdbd2cSJim Jagielski                                                    (void*)hContext,
177*b1cdbd2cSJim Jagielski                                                    pSrcBuf, nSrcBytes,
178*b1cdbd2cSJim Jagielski                                                    pDestBuf, nDestChars,
179*b1cdbd2cSJim Jagielski                                                    nFlags, pInfo,
180*b1cdbd2cSJim Jagielski                                                    pSrcCvtBytes );
181*b1cdbd2cSJim Jagielski }
182*b1cdbd2cSJim Jagielski 
183*b1cdbd2cSJim Jagielski /* ======================================================================= */
184*b1cdbd2cSJim Jagielski 
rtl_createUnicodeToTextConverter(rtl_TextEncoding eTextEncoding)185*b1cdbd2cSJim Jagielski rtl_UnicodeToTextConverter SAL_CALL rtl_createUnicodeToTextConverter( rtl_TextEncoding eTextEncoding )
186*b1cdbd2cSJim Jagielski {
187*b1cdbd2cSJim Jagielski     const ImplTextEncodingData* pData = Impl_getTextEncodingData( eTextEncoding );
188*b1cdbd2cSJim Jagielski     if ( pData )
189*b1cdbd2cSJim Jagielski         return (rtl_TextToUnicodeConverter) &pData->maConverter;
190*b1cdbd2cSJim Jagielski     else
191*b1cdbd2cSJim Jagielski         return 0;
192*b1cdbd2cSJim Jagielski }
193*b1cdbd2cSJim Jagielski 
194*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
195*b1cdbd2cSJim Jagielski 
rtl_destroyUnicodeToTextConverter(rtl_UnicodeToTextConverter hConverter)196*b1cdbd2cSJim Jagielski void SAL_CALL rtl_destroyUnicodeToTextConverter( rtl_UnicodeToTextConverter hConverter )
197*b1cdbd2cSJim Jagielski {
198*b1cdbd2cSJim Jagielski     (void) hConverter; /* unused */
199*b1cdbd2cSJim Jagielski }
200*b1cdbd2cSJim Jagielski 
201*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
202*b1cdbd2cSJim Jagielski 
rtl_createUnicodeToTextContext(rtl_UnicodeToTextConverter hConverter)203*b1cdbd2cSJim Jagielski rtl_UnicodeToTextContext SAL_CALL rtl_createUnicodeToTextContext( rtl_UnicodeToTextConverter hConverter )
204*b1cdbd2cSJim Jagielski {
205*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
206*b1cdbd2cSJim Jagielski     if ( !pConverter )
207*b1cdbd2cSJim Jagielski         return 0;
208*b1cdbd2cSJim Jagielski     else if ( pConverter->mpCreateUnicodeToTextContext )
209*b1cdbd2cSJim Jagielski         return (rtl_UnicodeToTextContext)pConverter->mpCreateUnicodeToTextContext();
210*b1cdbd2cSJim Jagielski     else
211*b1cdbd2cSJim Jagielski         return (rtl_UnicodeToTextContext)1;
212*b1cdbd2cSJim Jagielski }
213*b1cdbd2cSJim Jagielski 
214*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
215*b1cdbd2cSJim Jagielski 
rtl_destroyUnicodeToTextContext(rtl_UnicodeToTextConverter hConverter,rtl_UnicodeToTextContext hContext)216*b1cdbd2cSJim Jagielski void SAL_CALL rtl_destroyUnicodeToTextContext( rtl_UnicodeToTextConverter hConverter,
217*b1cdbd2cSJim Jagielski                                                rtl_UnicodeToTextContext hContext )
218*b1cdbd2cSJim Jagielski {
219*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
220*b1cdbd2cSJim Jagielski     if ( pConverter && hContext && pConverter->mpDestroyUnicodeToTextContext )
221*b1cdbd2cSJim Jagielski         pConverter->mpDestroyUnicodeToTextContext( (void*)hContext );
222*b1cdbd2cSJim Jagielski }
223*b1cdbd2cSJim Jagielski 
224*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
225*b1cdbd2cSJim Jagielski 
rtl_resetUnicodeToTextContext(rtl_UnicodeToTextConverter hConverter,rtl_UnicodeToTextContext hContext)226*b1cdbd2cSJim Jagielski void SAL_CALL rtl_resetUnicodeToTextContext( rtl_UnicodeToTextConverter hConverter,
227*b1cdbd2cSJim Jagielski                                              rtl_UnicodeToTextContext hContext )
228*b1cdbd2cSJim Jagielski {
229*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
230*b1cdbd2cSJim Jagielski     if ( pConverter && hContext && pConverter->mpResetUnicodeToTextContext )
231*b1cdbd2cSJim Jagielski         pConverter->mpResetUnicodeToTextContext( (void*)hContext );
232*b1cdbd2cSJim Jagielski }
233*b1cdbd2cSJim Jagielski 
234*b1cdbd2cSJim Jagielski /* ----------------------------------------------------------------------- */
235*b1cdbd2cSJim Jagielski 
rtl_convertUnicodeToText(rtl_UnicodeToTextConverter hConverter,rtl_UnicodeToTextContext hContext,const sal_Unicode * pSrcBuf,sal_Size nSrcChars,sal_Char * pDestBuf,sal_Size nDestBytes,sal_uInt32 nFlags,sal_uInt32 * pInfo,sal_Size * pSrcCvtChars)236*b1cdbd2cSJim Jagielski sal_Size SAL_CALL rtl_convertUnicodeToText( rtl_UnicodeToTextConverter hConverter,
237*b1cdbd2cSJim Jagielski                                             rtl_UnicodeToTextContext hContext,
238*b1cdbd2cSJim Jagielski                                             const sal_Unicode* pSrcBuf, sal_Size nSrcChars,
239*b1cdbd2cSJim Jagielski                                             sal_Char* pDestBuf, sal_Size nDestBytes,
240*b1cdbd2cSJim Jagielski                                             sal_uInt32 nFlags, sal_uInt32* pInfo,
241*b1cdbd2cSJim Jagielski                                             sal_Size* pSrcCvtChars )
242*b1cdbd2cSJim Jagielski {
243*b1cdbd2cSJim Jagielski     const ImplTextConverter* pConverter = (const ImplTextConverter*)hConverter;
244*b1cdbd2cSJim Jagielski 
245*b1cdbd2cSJim Jagielski     /* Only temporaer, because we don't want die, if we don't have a
246*b1cdbd2cSJim Jagielski        converter, because not all converters are implemented yet */
247*b1cdbd2cSJim Jagielski     if ( !pConverter )
248*b1cdbd2cSJim Jagielski     {
249*b1cdbd2cSJim Jagielski         return ImplUnicodeToDummy( pSrcBuf, nSrcChars,
250*b1cdbd2cSJim Jagielski                                    pDestBuf, nDestBytes,
251*b1cdbd2cSJim Jagielski                                    nFlags, pInfo, pSrcCvtChars );
252*b1cdbd2cSJim Jagielski     }
253*b1cdbd2cSJim Jagielski 
254*b1cdbd2cSJim Jagielski     return pConverter->mpConvertUnicodeToTextProc( pConverter->mpConvertData,
255*b1cdbd2cSJim Jagielski                                                    (void*)hContext,
256*b1cdbd2cSJim Jagielski                                                    pSrcBuf, nSrcChars,
257*b1cdbd2cSJim Jagielski                                                    pDestBuf, nDestBytes,
258*b1cdbd2cSJim Jagielski                                                    nFlags, pInfo,
259*b1cdbd2cSJim Jagielski                                                    pSrcCvtChars );
260*b1cdbd2cSJim Jagielski }
261