Tabla de caracteres alfabéticos (ISISAC.TAB)

 

En los procesos de generación de claves para consultas a la base de datos, existe una técnica de indización que permite realizar búsquedas utilizando cualquier palabra contenida en un campo. Esta técnica de indización extrae cada una de las palabras del campo y las envía a la lista invertida como claves independientes.

Para ejecutar este proceso CDS/Isis analiza cada caracter del campo cuya indización se solicita para extraer las palabras, y considera palabras aquellas secuencias de caracteres que están formadas por los caracteres incluídos en la tabla ISISAC.TAB. De tal forma que si un caracter es omitido de isiacc.tab CDS/Isis lo considera como un caracter no alfabético y corta la cadena que está analizando al considerar que llegó al fin de una palabra.

La tabla isisac.tab tiene el siguiente contenido:

    048 049 050 051 052 053 054 055 056 057 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080 081 082 083 084 085 086
    087 088 089 090 097 098 099 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 192 193
    194 195 196 197 199 200 201 202 203 204 205 206 207 209 210 211 212 213 214 216 217 218 219 220 221 224 225 226 227 228 229 231
    232 233 234 235 236 237 238 239 241 242 243 244 245 246 248 249 250 251 252 253 255

Cualquier código ANSI que se omita en esta tabla será considerado como no alfabético. En esta tabla en particular hemos incluído los números del 0 al 9 (códigos 048 al 057) porque es de nuestro interés indizar como palabras aquellos casos de títulos u otras frases que contengan valores numéricos como fechas y otras referencias. Si desea incluir otros símbolos en la indización por técnica 4 u 8, solo tiene que conseguir su código ANSI e insertarlo en el lugar correspondiente a su secuencia

ABCD coloca por defecto esta tabla en la raíz de la carpeta bases contentiva de las carpetas de bases datos. Si usted no desea que los números se incluyan en la indización por técnicas 4 u 8 debe modificar el archivo isisuc.tab suministrado por defecto y eliminar los códigos 048 a 057 y conservar el formato de la tabla, es decir, 32 códigos ansi por línea.

Puede crear un archivo isisac.tab para bases de datos específicas. En ese caso colóquelo en otra carpeta o cree uno nuevo con otro nombre y ajuste el parámetro correspondiente al isisac.tab del archivo .par de la base de datos e indique la ruta donde está localizado el nuevo archivo isisac.tab. De esta forma, cuando el proceso de ingreso o modificación de registros vaya a actualizar la lista invertida, utilizará el archivo isisac.tab requerido para determinar los caracteres a ser considerados como alfabéticos.

Nota importante:

  • Cuando indize un campo por técnica 4 u 8 recuerde siempre incluir los comandos MPU y MPL como parte del formato de extracción.
    Ejemplo, MPU, V10, MPL.
  • Si está indizando un campo repetible por técnica 4 u 8 debe incluir un separador entre las ocurrencias para evitar que la última palabra de la ocurrencia actual se junte con la primera palabra de la próxima ocurrencia.
    Ejemplo, mpu,v10+|  |, mpl
             mpu (v10/) mpl