ذخیره سازی سند
تدوين:شهنازپیروزفر
ذخیره سازی سند بعضی از عناصر را با ذخیره سازی دادهها به اشتراك میگذارد ، لذا ما در ابتدا دو تعریف ذخیره سازی را مرور میكنیم . چهار ویژگی ذخیره سازی عبارتند از :
موضوع-گرا
یكپارچه
تغیر- زمانی
پایدار
موضوعگرا بدین معناست كه دادهها به جای اینكه پیرامون عملیات نیازمندیهای پردازشی سازماندهی شوند، پیرامون موضوع خاصی ساماندهی میشوند. انبارهای دادهها یكپارچه هستند، زیرا دادهها از چندین منبع جمع آوری میشوند .تغیر- زمانی بدین معناست كه دادههای موجود در انبار دادهها در دوره زمانی خاصی شناسایی میشوند و سرانجام اینكه ویژگی پایداری یعنی دادهها به محض اینكه به انباردادهها افزوده شدند،حذف نمیشوند.
خصوصیات ذخیره سازی سندعبارتند از :
یك نوع یا یك ساختار سند وجودندارد.
اسناد برگرفته از چندین منبع هستند.
گونههای اصلی اسناد به طورخودكار استخراج و در انبار سند ذخیره میشوند.
انبارهای اسناد برای یكپارچه سازیاسنادی كه از نظر معنایی به هم وابستهاند، طراحی میشوند.
شكل 1: انبارهای سند، برگرفته از چندینمنبع
انواع سند
اغلب برنامههای DMS با یك نوع سند نظیر فرمهای شكایت بیمه سروكار دارند. هر نوع سندی میتواند در انبارسند مورد استفاده قرارگیرد. با این وجود،نحوه پردازش اسناد با توجه به نوعشان، متفاوت است. برایمثال، پست الكترونیك نسبتا كوتاه است، لذا نیازیبه استفاده از تكنیكهای اتومات خلاصه سازی نیست. هنگامی كه اسناد از منابع داخلی جمع آوری میشوند، عموما زبانی را كه برای نوشتن سند استفاده شده است، میشناسیم. با این وجود، متون جمعآوری شده از وب میتوانند به هر زبانی باشند. به همین دلیل، اولین گام، شناسایی زبان سند است، یا از طریق متا دادههای موجود در صفحه وب یا با به كارگیری برنامه شناساییزبان.
منابع چندگانه
خصوصیت دوم انبارهای سند این است كه اسناد از چند منبع به دست میآیند. سازمانها، كامپیوترهای شخصی، سرور و SAN (Storage Area Network دارند كه با سند بارگذاری میشوند و حاوی اطلاعات كلیدی كسب و كار هستند. ما میتوانیم با كمك انبار سند، اسناد را به گونهای ساختیافته در آوریم تا از تجزیه و تحلیل و بازیابی محتوای معنایی سند پشتیبانی كند، نه صفات خارجی نظیر مكان و نام فایل. لذا هنگامی كه فردی بخواهد با محتویات سند كار كند، محدودیت فضای ذخیرهسازی مبتنی بر فایل سیستم به خوبی مشخص میشود. برای مثال وكلایی كه برای پیگیری پروندهها با حجم عظیمی از متون سر و كار دارند از پایگاه متنی استفاده میكنند. این پایگاه برای ذخیرهسازی و شاخص گذاری متن به كار میرود. و در حالیكه نیازهای بسیاری از كاربران را برآورده میسازد اما استخراج اطلاعات را انجام نمیدهد یا آنرا از نظر معنایی به سایر اسناد مرتبط نمیسازد. پایگاههای متنی و سيستمهاي مديريت سند بر خلاف انباردادهها كه برای تصمیمگیری به كار میروند، عملیات تراكنش- گرا نظیر یافتن اسنادی را كه حاوی عبارت خاصی هستند، انجام میدهند. پس دلیل استفاده از چند منبع این است كه یك منبع به تنهاییحاوی همه اطلاعات مورد نیاز ما نیست.
استخراج محتوایمعنایی
استخراج محتوای سند فرایند مهمی در ذخیرهسازی سند محسوب میشود. این كار به روشهای مختلف انجام میشود كه عبارتند از:
شناسایی موضوعات مهم
استخراج گونههای كلیدی
خلاصهسازی محتوا
گاهی اوقات شناسایی موضوعات مهم، ردهبندی نامیده میشود. این روش برای شاخصگذاری موضوعی سودمند است و به ما امكان میدهد تا در خواست خود را به كمك موضوعات بیابیم نه فقط با كلید واژهها. گونههای كلیدی سند عبارتند از: نام اشخاص، اماكن، سازمانها و ارتباط بین آنها. گونههای كلیدی نیز همانند شاخصگذاری موضوعی شناسایی میكند كه سند درباره چیست، اما میتواند جزییات بیشتری را در این باره استخراج نماید. اغلب، نیازی نیست كه همه متن خوانده شود، بلكه خواندن چكیده آن كافیست. در حال حاضر، ابزارهای بسیاری برای خلاصه سازی محتوا وجود دارند. در واقع، این ابزارها واژههای مشترك در متن را مییابند.
سپس جملات با توجه به تعداد واژگانی كه دارند، وزن دهی میشوند. در واقع، خلاصهسازی روش موثری برای كاهش دادن كاربران نهایی انبار سند است.
مزایای ذخیرهسازیسند
مهمترین مزیت ذخیرهسازی سند این است كه حوزه رسیدن به هوشمندی تجاری را بسط میدهد. در جاییكه هدفمان بهبود عملیات كسب و كار، فروش، بازاریابی یا تحقیق و توسعه است، بهرهگیری از اطلاعات متنی در مقایسه با كسانی كه فقط از عدد و شماره استفاده میكنند، مزیت رقابتی به شمار میرود. بعضی از مزایای عمده ذخیرهسازی سند عبارتند از:
هوشمندی تجاری غنیتر
شناخت مشتریان
نظارت فرا محیط
سنجش تكنولوژی
هوشمندی تجاری غنیتر
ذخیرهسازی سند امكان میدهد تا فراتر از سنجشهای عددی كارآیی، حركت كنیم. البته این سنجشها نیز ضروریند و اولین راه برای ردیابی عملیات محسوب میشوند. اما تصویر كاملی از اشتباهاتی كه روی میدهند، نشان نمیدهند. كاهش تولید یا افزایش مشكلات كنترل كیفیت را میتوان به سرعت با گزارشگیری یا ابزارهای مربوطه رفع نمود، اما دلیل روی دادنشان را نمیدانیم. شاید تولید به دلیل تاخیر در عرضه اجزای ضروری افت كرده باشد. آیا ممكن است مشكلات مربوط به فروشنده نیز نقش داشته باشند؟ آیا میتوان افت تولید را پیش بینی كرد و مثلا با ردیابی وضعیت مالی فروشنده از آن پیشگیری نمود؟ شاید، اما بدون بهرهگیری از ابزارهای اتومات، ردیابی اطلاعات متنی كارآیی چندانی ندارد. اتومات سازی جمعآوری اطلاعات سبب میشود تا فقط حقایق و گونههای اصلی شناسایی شوند و سیاستگذاران با در اختیار داشتن این اطلاعات میتوانند حوزه هوشمندی تجاری را در زمینه عملیات كلیدی بسط دهند.
شناخت مشتریان
بازاریابی شخصی در برخی از صنایع مشتریمدار، جایگزین بازاریابی انبوه شده است. زیرا فروشندگان میتوانند جزییات الگوهای خرید و علائق شخصی را ردیابی كنند و بدین ترتیب بازاریابها میتوانند مشتریان را هدف قرار دهند. فعالیت در دنیای كسب و كار-كسب و كار، داستان متفاوتی اما با همان قوانین دارد. اگر درباره مشتریان تجاری خود اطلاعات كافی داشته باشید، بهتر میتوانید آنان را هدف قرار دهید. آیا تغییر محیط برای مشتریان شما فرصت ایجاد میكند یا تهدید محسوب میشود؟ چگونه جهانی شدنی بر آنان تاثیر میگذارد؟ آیا تاثیر پذیریشان یكسان است یا متفاوت؟ آیا خط تولید یا خدمت شما میتواند با توجه به تغییر بازار با مشتریان شما سازگار شود؟ پاسخ به این پرسشها نیاز به زمان و تجزیه و تحلیل دارد. انبار سند سبب كارآمدتر شدن این فرایند میشود.
مدیریت استراتژیك و فرامحیط
مدیریت استراتژیك هنر و علم هدایت شركتها در رویارویی با پیشامدهای داخل و خارج از سازمان است. مدیران استراتژیك باید بتوانند پرسشهای زیر را پاسخ دهند. آیا شركت یك تولید كننده ارزان است یا گران؟ چگونه شركت میتواند خط تولید خود را متمایز سازد؟ آیا باید بر بخشی از بازار متمركز شود یا كل آن؟ تصمیمگیری بدون توجه به این كه سایرین چه كار میكنند، نتایج دور از انتظاری را بوجود میآورد.
سنجش تكنولوژی
تغییرات سریع در تكنولوژی برای برخی محصولات مانع و برای برخی دیگر فرصت محسوب میشود. شركتها با درك جایگاه تكنولوژیاشان در صنعت میتوانند از چالشهای دور از انتظار پیشگیری كنند. و این امر مستلزم آگاهی از تكنولوژی رقباست.
Copyright 2004, PC World Iran. All rights reserved.