当前位置:首页 » 编程语言 » java文本分类

java文本分类

发布时间: 2023-01-01 11:50:07

㈠ 如何用java实现根据文件后缀名分类文件,并且将文件复制到不同的文件夹

处理的代码逻辑如下:

	publicstaticvoidmain(Stringargs[]){
StringsaveToFileDir="F:\整理后的文件存放目录";
Filefile=newFile("F:\所需整理的文件目录");
processFileFenLei(saveToFileDir,file);
}

(StringsaveToFileDir,Filefile){
if(file.getName().startsWith(".")){
return;
}
System.out.println("当前处理位置===>"+file.getAbsolutePath());
if(file.isFile()){
processCopyFile(saveToFileDir,file);
}else{
File[]subFiles=file.listFiles();
for(FilesubFile:subFiles){
processFileFenLei(saveToFileDir,subFile);
}
}
}

(StringsaveToFileDir,Filefile){
StringextFileName=FileCreateUtil.getFileExtension(file);
StringwholeDir=saveToFileDir+"\"+extFileName;
FilefileDir=newFile(wholeDir);
if(!fileDir.exists()){
fileDir.mkdirs();
}
FilesaveToFile=newFile(wholeDir+"\"+file.getName());
FileCreateUtil.saveFileToFile(file,saveToFile);
}

以上代码中所用到的文件操作工具类:

importjava.io.BufferedInputStream;
importjava.io.BufferedOutputStream;
importjava.io.BufferedReader;
importjava.io.BufferedWriter;
importjava.io.File;
importjava.io.FileInputStream;
importjava.io.FileNotFoundException;
importjava.io.FileOutputStream;
importjava.io.FileReader;
importjava.io.FileWriter;
importjava.io.IOException;
importjava.io.InputStream;
importjava.io.InputStreamReader;
importjava.sql.Blob;
importjava.sql.SQLException;

/**
*@作者王建明
*@创建日期Feb4,2010
*@创建时间9:56:15AM
*@版本号V1.0
*/
publicclassFileCreateUtil{
_TYPE_IMAGE="image/jpeg";

/**
*@说明将二进制字节流保存为文件
*@parambyteArry二进制流
*@paramfile要保存的文件
*@throwsSQLException
*@throwsIOException
*/
(byte[]byteArry,Filefile)
throwsSQLException,IOException{
BufferedOutputStreambos=newBufferedOutputStream(
newFileOutputStream(file));
bos.write(byteArry);
bos.close();
}

/**
*@说明将文件转换为二进制字节流
*@paramfile要转换的文件
*@return
*@throwsSQLException
*@throwsIOException
*/
publicstaticbyte[]changeFile2Bytes(Filefile)throwsSQLException,
IOException{
longlen=file.length();
byte[]bytes=newbyte[(int)len];
FileInputStreaminputStream=newFileInputStream(file);
=newBufferedInputStream(
inputStream);
intr=bufferedInputStream.read(bytes);
if(r!=len){
thrownewIOException("Filereaderror");
}
inputStream.close();
bufferedInputStream.close();
returnbytes;
}

/**
*@说明将Blob类类型的文件转换成二进制字节流
*@parampic
*@return
*@throwsSQLException
*@throwsIOException
*/
publicstaticbyte[]changeBlob2Bytes(Blobpic)throwsSQLException,
IOException{
byte[]bytes=pic.getBytes(1,(int)pic.length());

returnbytes;
}

/**
*@说明将Blob类类型的数据保存为本地文件
*@paramblob
*@paramfile
*@throwsSQLException
*@throwsIOException
*/
publicstaticvoidsaveBlob2File(Blobblob,Filefile)throwsSQLException,
IOException{
InputStreamis=blob.getBinaryStream();
BufferedOutputStreambos=newBufferedOutputStream(
newFileOutputStream(file));
intb=-1;
while((b=is.read())!=-1){
bos.write(b);
}
bos.close();
is.close();
}

/**
*@说明将一个文件拷贝到另一个文件中
*@paramoldFile源文件
*@paramnewFile目标文件
*/
(FileoldFile,FilenewFile){
FileInputStreamfis=null;
FileOutputStreamfos=null;
try{
fis=newFileInputStream(oldFile);//建立文件输入流

fos=newFileOutputStream(newFile);

intr;
while((r=fis.read())!=-1){
fos.write((byte)r);
}
}catch(FileNotFoundExceptionex){
System.out.println("SourceFilenotfound");
}catch(IOExceptionex){
System.out.println(ex.getMessage());
}finally{
try{
if(fis!=null)
fis.close();
if(fos!=null)
fos.close();
}catch(IOExceptionex){
System.out.println(ex);
}
}
}

/**
*@说明获取文本形式文件的内容
*@paramfile要读取的文件
*@return
*/
(Filefile){
BufferedReaderbr=null;
try{
br=newBufferedReader(newFileReader(file));
Stringline=null;
StringBuildersb=newStringBuilder((int)file.length());
while((line=br.readLine())!=null){
sb.append(line);
sb.append(" ");
}
returnsb.toString();
}catch(FileNotFoundExceptione){
e.printStackTrace();
System.out.println("Filenotfound");
}catch(IOExceptione){
e.printStackTrace();
System.out.println("Readfileerror");
}finally{
try{
if(br!=null)
br.close();
}catch(IOExceptione){
//TODOAuto-generatedcatchblock
e.printStackTrace();
}
}
return"";
}

/**
*@说明把一个文件转化为字节
*@paramfile
*@returnbyte[]
*@throwsException
*/
publicstaticbyte[]getByteFromFile(Filefile)throwsException{
byte[]bytes=null;
if(file!=null){
InputStreamis=newFileInputStream(file);
intlength=(int)file.length();
if(length>Integer.MAX_VALUE)//当文件的长度超过了int的最大值
{
System.out.println("thisfileismax");
returnnull;
}
bytes=newbyte[length];
intoffset=0;
intnumRead=0;
while(offset<bytes.length
&&(numRead=is.read(bytes,offset,bytes.length-offset))>=0){
offset+=numRead;
}
//如果得到的字节长度和file实际的长度不一致就可能出错了
if(offset<bytes.length){
System.out.println("filelengthiserror");
returnnull;
}
is.close();
}
returnbytes;
}

/**
*@说明将指定文本内容写入到指定文件中(原文件将被覆盖!)
*@paramcontent要写入的内容
*@paramfile写到的文件
*/
(Stringcontent,Filefile){
try{
if(file.exists()){
file.delete();
}
file.createNewFile();

FileWriterfw=newFileWriter(file,true);
BufferedWriterbw=newBufferedWriter(fw);
bw.write(content);
bw.close();
fw.close();
}catch(IOExceptione){
System.out.println("Writefileerror");
e.printStackTrace();
}
}

/**
*@paramfile
*@paramencode
*@return
*@throwsException
*T:2012-03-0111:12:51A:王建明X:问题ID——R:备注——读取文件时设置txt文件的编码方式
*/
(Filefile,Stringencode)
throwsException{
StringBuildersb=newStringBuilder();
if(file.isFile()&&file.exists()){
InputStreamReaderinsReader=newInputStreamReader(
newFileInputStream(file),encode);

BufferedReaderbufReader=newBufferedReader(insReader);

Stringline=newString();
while((line=bufReader.readLine())!=null){
//System.out.println(line);
sb.append(line+" ");
}
bufReader.close();
insReader.close();
}
returnsb.toString();
}

/**
*@paramfile
*@returnT:2012-03-0111:12:25A:王建明X:问题ID——R:备注——获取txt文件的编码格式
*/
(Filefile){
Stringcode="";
try{
InputStreaminputStream=newFileInputStream(file);
byte[]head=newbyte[3];
inputStream.read(head);

code="gb2312";
if(head[0]==-1&&head[1]==-2)
code="UTF-16";
if(head[0]==-2&&head[1]==-1)
code="Unicode";
if((head[0]==-17&&head[1]==-69&&head[2]==-65))
code="UTF-8";
}catch(FileNotFoundExceptione){
e.printStackTrace();
}catch(IOExceptione){
e.printStackTrace();
}
returncode;
}

/**
*@说明获取文件后缀名
*@paramfile
*@return
*/
(Filefile){
if(file!=null&&file.isFile()){
Stringfilename=file.getName();
inti=filename.lastIndexOf(".");
if(i>0&&i<filename.length()-1){
returnfilename.substring(i+1).toLowerCase();
}
}
return"";
}

/**
*@说明删除文件或文件夹
*@paramfile
*@作者王建明
*@创建日期2012-5-26
*@创建时间上午09:36:58
*@描述——
*/
publicstaticvoiddeleteFile(Filefile){
if(file.exists()){//判断文件是否存在
if(file.isFile()){//判断是否是文件
file.delete();//delete()方法你应该知道是删除的意思;
}elseif(file.isDirectory()){//否则如果它是一个目录
Filefiles[]=file.listFiles();//声明目录下所有的文件files[];
for(inti=0;i<files.length;i++){//遍历目录下所有的文件
deleteFile(files[i]);//把每个文件用这个方法进行迭代
}
}
file.delete();
}else{
System.out.println("所删除的文件不存在!"+' ');
}
}

/**
*@说明创建文件夹,如果不存在的话
*@paramdirPath
*@作者王建明
*@创建日期2012-5-26
*@创建时间上午09:49:12
*@描述——
*/
publicstaticvoidcreateMirs(StringdirPath){
FiledirPathFile=newFile(dirPath);
if(!dirPathFile.exists())
dirPathFile.mkdirs();
}
}

㈡ java中处理中文输入,不需要用到的类是

Java把不同类型的输入、输出抽象为流stream,分为输入流和输出流,用统一的接口来表示
Java开发环境中提供了包java.io,其中包括一系列的类来实现输入/输出处理
InputStream是所有字节输入流的祖先,而OutputStream是所有字节输出流的祖先
public abstract class InputStream implements Closeable
public abstract class OutputStream implements Closeable, Flushable
具体子类: ByteArrayInputStream, FileInputStream, FilterInputStream, ObjectInputStream,
PipedInputStream, SequenceInputStream, StringBufferInputStream
InputStream
InputStream类是一个抽象类,方法包括:
int read()
int read(byte[])
int read(byte[],int,int)
void close()关闭流
int available()报告流中直接可读的字节数
skip(long)跳过流中指定的字节
OutputStream
OutputStream也是一个抽象类。它的主要方法包括:
void write(int)
void write(byte[])
void write(byte[],int,int)
其中第一个方法的int型的参数对应要写入的字节,后两个方法的参数与InputStream类似。
void close() 关闭输出流
void flush() 强行将写入缓冲区中剩余的数据写入
File file = new File("d:\\FileTest.java");
if (file.exists()) {
try (InputStream is = new FileInputStream(file);) {
byte[] buffer = new byte[8192];
int len = is.read(buffer);
while (len > 0) {
System.out.write(buffer, 0, len);
len = is.read(buffer);
}
} catch (Exception e) {
e.printStackTrace();
}
}
InputSream 和 OutputStream 中定义了 read() 和 write() 方法,它们被派生流类重载。字节流是字节序
列,它与外部设备中的字节存在着一一对应的关系,不存在字符的转换,被读写字节的个数与外部设备中的字节个数是相同的
基本输入输出方法
System类是Java语言中一个功能强大、非常有用的类,它提供了标准输入/输出及运行时的系统信息
System类不能创建对象,也就是说,System类的所有属性和方法都是静态的,引用时要以System 作为前缀
System.in与System.out是System类的两个静态属性,分别对应了系统的标准输入/输出流 System类管理标准输入输出流和错误流
System.out:把输出送到缺省的显示(通常是显示器),是PrintStream的对象
System.in:从标准输入获取输入(通常是键盘),是InputStream的对象
System.err:把错误信息送到缺省的显示,是PrintStream的对象
同时使用System.out和System.err输出信息不能保证显示顺序就是执行顺序,为了避免这种情况在测试代码执行中经常使用System.err输出

FileInputStream、FileOutputStream 顺序读取文件
PipedInputStream、PipedOutputStream 管道
ByteArrayInputStream、ByteArrayOutputStream 内存读写
FilterInputStream、FilterOutputStream 过滤流(有多线程同步)
DataInputStream、DataOutputStream 对数据类型读写,有多线程同步
BufferedInputStream、BufferedOutputStream 缓冲类型读写

1 、使用字节流进行文件的单字节复制
FileInputStream是InputStream的子类,FileInputStream属于节点流,用于按字节读取文件内容
FileOutputStream是OutputStream的子类,FileOutputStream属于节点流,用于按字节输出数据到文件中
//FileInputStream中read方法的定义
/**
从指定的输入流中按字节读取数据,如果读到流的末尾则返回-1,否则返回读取到的数据。如果文件不存
在则异常FileNotFoundException【IOException的子类】
*/
public int read() throws IOException {
return read0();
}
//FileOutputStream中write方法的定义
//属性,用于表示是否进行文件的追加操作而不是覆盖操作
private final boolean append;
//构造器方法的定义,其中name是文件名称,默认采用覆盖操作
public FileOutputStream(String name) throws FileNotFoundException {
this(name != null ? new File(name) : null, false);
}
//按照字节执行写出int数据,自动会去除多余的字节。如果文件不存在则自动创建新文件,如果
文件已经存在则按照append的值决定采用的是追加操作还是覆盖操作
public void write(int b) throws IOException {
write(b, append);
}
private native void write(int b, boolean append) throws IOException; //
由VM采用对等类的方式提供实现
public class Test1 {
public static void main(String[] args) throws IOException {
try (InputStream is = new FileInputStream("c:/面向对象文档.txt");
OutputStream os = new FileOutputStream("test.txt");) {
int kk;
while ((kk = is.read()) != -1) {
os.write(kk);
}
}
}
}
2 、读取 A.java 文件并在控制台上显示
如何使用控制台输出 : System.out 字节流
分析:使用字节流从 A.java 中一个字节一个字节的读取内容,然后再使用 System.out.print 方法输出即可
注意:读取操作返回的 int 的取值范围为 0-255 ,则表示这里不会有符号位,所以 is.read()==-1 不是只适合于文本文件
File ff = new File("T1.java");
if (ff.exists()) {// 如果文件存在则进行拷贝操作,否则提示文件不存在
InputStream is = new FileInputStream(ff);
OutputStream os = new FileOutputStream("t1.bak");
while (true) {
int kk = is.read();// 返回值应该是0-255,如果返回-1表示流已经结束
if (kk < 0)break;
os.write(kk);
}
is.close();
os.close();
} else
System.out.println("T1.java文件不存在");
InputStream基本输入类
InputStream类是基本的输入类。它定义了所有输入流所需的方法。

public abstract int read() throws IOException读取一个字节并以整数的形式返回,0-255。如果 返回-1已到输入流的末尾。
public int read(byte b[]) throws IOException读取一系列字节并存储到一个数组,返回实际读取的 字节数。如果已经读到输入流的末尾则返回-1
public void close() throws IOException 关闭输入流并释放资源
public int read(byte b[],int offset,int length) throws IOException功能为从输入流中读数据。这一 方法有几种重载形式,可以读一个字节或一组字节。当遇到文件尾时,返回-1。最后一种形式中的 offset是指把结果放在b[]中从第offset个字节开始的空间,length为长度
public long skip (long n) throws IOEnception 从输入流跳过几个字节。返回值为实际跳过的字节数
OutputStream基本输出类
三个重载形式都是用来向输出流写数据的
public abstract void write(int b)向输入流写入一个字节数据,该字节为参数的低8位。
public void write(byte b[],int offset,int length)将一个字节类型的数组中的从指定位置offset开始 的length个字节写入到输出流
public void close( ) 关闭输出流,释放资源
public void write(byte b[])将一个字节类型的数组中的数据写入到输出流
public void flush() 清除缓冲区,将缓冲区内尚未写出的数据全部输出
字符流
在顶层有 Reader 和 Writer 两个抽象类。 Reader 和 Writer 中定义了 read() 和 write() 方法,它们被派生流类重载
Reader 抽象类的定义
public abstract class Reader implements Readable, Closeable {
//BIO,读取一个有效的字符,返回值为0到65535的整数,如果到达流的末尾则返回-1
public int read() throws IOException
//BIO,读取字符存储到char数组中,返回读取的字符个数,流结束则返回-1
public int read(char cbuf[]) throws IOException
//关闭流,同时释放资源
abstract public void close() throws IOException;
Writer 抽象类的定义
public abstract class Writer implements Appendable, Closeable, Flushable {
//写出一个字符到字符流,要写的字符包含在给定整数值的16个低位;16个高位被忽略。
public void write(int c) throws IOException
//将字符数组中的指定部分内容压入到字符流,从off开始共len个字符
abstract public void write(char cbuf[], int off, int len) throws
IOException;
/关闭流,同时释放资源
abstract public void close() throws IOException;
相关的子类
InputStreamReader、OutputStreamWriter桥接流,用于自动实现字节流和字符流的转换
FileReader、FileWriter文件流,用于实现针对文本文件的读写操作
CharArrayReader、CharArrayWriter内存流,用于实现针对char数组的读写操作
PipedReader、PipedWriter管道流,用于线程之间的通讯
FilterReader、FilterWriter过滤流的父类
BufferedReader、BufferedWriter缓存流,用于在流中添加缓冲区
StringReader、StringWriter内存流,用于实现针对字符串的读写操作

使用字符流实现 txt 文件的读取显示【其中包含中文】
编写一个程序,读取文件 test.txt 的内容并在控制台输出。如果源文件不存在,则显示相应的错误信息。
字符流 Reader
int read()读取一个字符并以整数的形式返回0-65535,如果返回-1则已到输入流末尾
int read(char[] cbuf)读取一系列字符并存储到一个数组中,返回实际读取的字符数,如果读到输入流末尾则返回-1
void close()关闭输入流并释放内存资源
int read(char[] cbuf, int off, int len) 读取len个字符并存储到一个数组中,从off位置开始,返回实
际读取的字符数,如果读取到输入流末尾则返回-1
long skip(long n)跳过n个字符不读,返回实际跳过的字节数
字符流 Writer
void write(int c) 将字符(int数组的低8位)压入到字符流中
void write(char[] cbuf, int off, int len)将字符数组中的指定部分内容压入到字符流中,从off开始共len个字符
void write(String str) 将字符串中的内容压入到字符流中
void close() 关闭流并释放所占用的资源
void write(String str, int off, int len) 将字符串中的指定部分内容压入到字符流中,从下标off开始共len个字符
void flush()刷新缓冲区,将缓冲区中的数据全部送出到目标地,然后清空缓冲区
void write(char[] cbuf) 将字符数组中的所有数据压入到字符流中
一般来说:一次读写一个字符效率太低,可以引入 char[] 数组提高执行效率
小结
在学些BIO时记忆父类的方法,区分子类的实现不同
InputStream中的方法 read(byte[]):int; Reader中方法read(char[]):int 如果到达流末尾 则-1
OutputStream中的方法 write(byte[],0,len):void;Writer中的方法 write(char[],0,len)/write(String)
一般在使用中,如果读取数据使用字节流,则写出数据采用的也是字节流;不建议混用,除非引入 桥接流
文件流
FileInputStream("file-name") FileInputStream(File) FileNotFoundException
FileReader("file-name") FileReader(File) FileNotFoundException
FileOutputStream("file-name") FileOutputStream("file-name",true) 默认文件覆盖,如果 参数true表示追加
FileWriter("file-name") FileWriter("file-name",true)
一般不使用单字节或者单字符的操作方法,使用数组
注意:try(){}是推荐写法,否则应该使用try{}finally{}结构保证流的关闭
针对二进制文件不建议使用字符流,建议使用字节流进行操作,否则有可能拷贝文件出现问题:

如果针对文本文件则建议使用字符流,因为编码使用比较方便

文章知识点与官方知识档案匹配
Java技能树类和接口类和面向对象
89124 人正在系统学习中
点击阅读全文
打开CSDN,阅读体验更佳

java用于输入输出流的类_java输入输出流_lsgn的博客
java输入输出流 java IO综述 在整个Java.io包中最重要的就是5个类和一个接口。5个类指的是File、OutputStream、InputStream、Writer、Reader;一个接口指的是Serializable。 Java I/O主要包括如下几个层次,包含三个部分: ...
java常见输入输出类型_3分钟秒懂大数据的博客
输入:每行输入一个数,连续输入n行,遇到0结束输入,然后输出结果。 importjava.util.ArrayList; importjava.util.Scanner; publicclassTest4{ publicstaticvoidmain(String[] args){ Scannersc=newScanner(System.in); ...
25、JAVA进阶——输入输出流
一、认识Java的流 二、使用字节流读写文本文件 1、使用字节流类FileInputStream读文本文件 2、使用字节流类FileOutputStream写文本文件 三、使用字符流读写文本文件 1、使用字符流类BufferedReader和FileReader读文本文件 2、使用字符流类BufferedWrite和FileWrite写文本文件 四、读写二进制文件 1、 使用字节流读二进制文件 2、 使用字节流写二进制文件 五、序列化和反序列化 1、认识序列化 2、序列化保存对
继续访问

java 输入类_java 输入输出类
java中输入输出类如果理不清思路的话就会很混乱!一.File类提供与操作系统无关的文件操作!可以查看api文档了解它的方法二.输出操作:1.把信息输出到屏幕上最简单的操作就是使用标准输出:System.out.println();下面讨论一下流方式的输出,与之相关的类如下OutputStreamWriter:它提供字符流到字节流的转换,换句话说它写入字符数据然后按照指定字符集转换为字节数据Buf...
继续访问
JAVA的输入输出_努力的地球人的博客_java输出
Java的输入 Scanner类 为了使用scanner类,我们首先需要导入java.util.Scanner包 import java.util.Scanner; 1 创建scanner对象,从用户获取输入 //创建scanner对象 Scanner str=new Scanner(System.in); //接受用户输入 int w=str.nextIn...
java输入输出_java中输入输出总结_weixin_39609407的博客
标准输入studin,对象是键盘。 标准输出stdout,对象是屏幕。 标准错误输出stderr,对象也是屏幕。 二、java.io包中的数据流和文件类 字节流:从InputStream和OutputStream派生出来的一系列类。这类流以字节(byte)为基本处理单位。
Java——不同数据类型的输入输出方式与转化方式
java 中不同数据类型的 输入方法 输出格式 与 转化方式
继续访问

Java文本输出常用类
package com.ss.extract; import java.io.*; import org.apache.log4j.Logger; /** * 结果输出类 * @author Shu */ public class ResultOutput { private ...
继续访问
1.Java基础入门 -(2)输入输出类_菜鸟的小虫子的博客
一. Java Scanner 类 java.util.Scanner是 Java5 的新特征,我们可以通过 Scanner 类来获取用户的输入。 Scanner 对象的基本语法: Scanner in= new Scanner(System.in); 示例1: 输入结果: ...
java的输入输出流类型_理解JAVA输入输出流_天接云涛的博客
1、字节流抽象类 InputStream输入流 OutputStream输出流 2、字符流抽象类 Reader 输入字符流 Writer 输出字符流 四、JAVA中流体系架构 有一些对流进行操作的基本的方法,我们以文件输入输出流进行说明: ...
java的输出类
System.out这个类是PrintStream类,定义如下 public class PrintStream extends FilterOutputStream PrintStream都是用print的相关函数输出到控制台上。print的实现都是用write(String s)实现。 而,PrintWriter这个输出类,也同样实现输出:PrintWriter extends ...
继续访问
Java中的各种输出形式
一、Java中的各种输出形式: package cn.jl.lwj; public class Demo00 { public static void main(String[] args) { //标识符定义 区分大小写 int a = 5; int A = 6; //区分大小写 int Class = 6; int age = 5; //定义常量 final int AGE_MAX = 30;...
继续访问
java中的BIO基础-3
java中的io基础
继续访问
Java学习-IO流进阶
缓冲流也称为高效流、或者高级流。之前学习的字节流可以称为原始流。
继续访问

IO进阶之高级IO
高级IO
继续访问
Java中的IO进阶操作
Java中的IO进阶操作 一、序列化和反序列化 常用于多台服务器之间进行java对象的数据传递。 1.概念 序列化 是指程序中准备好的Java对象,永久的保存在磁盘中,这个过程其实是一个out的动作。 ObjectOutputStream:通过在流中使用文件可以实现对象的持久存储。 创建对象:ObjectOutputStream(OutputStream out) 常用方法: void writeObject(Object obj):将指定的对象写入ObjectOutputStream 反序列化 是指把
继续访问
Java IO最详解,欢迎提出意见
Java IO 详解 初学java,一直搞不懂java里面的io关系,在网上找了很多大多都是给个结构图草草描述也看的不是很懂。而且没有结合到java7 的最新技术,所以自己来整理一下,有错的话请指正,也希望大家提出宝贵意见。 首先看个图:(如果你也是初学者,我相信你看了真个人都不好了,想想java设计者真是煞费苦心啊!) 这是java io 比较基本的一些处理流,除此之外我们还会...
继续访问
java输出类型_java中各种类型的输入输出
import java.lang.Exception;import java.lang.String;import java.util.Scanner;public class test {public static void main(String[] args) {Scanner s = new Scanner(System.in);char ch;System.out.print("Char...
继续访问
java中输入流的类_Java中的输入/输出流类
Java中包含的输入/输出流类 1.java.io包中的接口 (1)处理字节流的有DataInput接口和DataOutput接口,RandomAccessFile同时实现了这两个接口; (2)处理对象流的有ObjectInput接口和ObjectOutput接口,ObjectInputStream类实现了ObjectInput接口,ObjectOutputStream类实现了ObjectOutp...
继续访问
使用java的输入/输出类
1. 什么是IO? I:input 输入 通常做读取操作(将不同数据源的数据读入到内存中,也叫读取流) O:output 输出通常做写入操作(将内存中的数据写入到不同的数据源,也叫写入流) 2. 理解流的概念。 想象一下自来水公司要把水输到用户家里,应该先把自来水公司到用户家里的连接水管建好,再将水输出去。管道里输送的是水,但IO里输送的是字节。 u流是...
继续访问
Java中的输入/输出流类
Java中包含的输入/输出流类 1.java.io包中的接口 (1)处理字节流的有DataInput接口和DataOutput接口,RandomAccessFile同时实现了这两个接口; (2)处理对象流的有ObjectInput接口和ObjectOutput接口,ObjectInputStream类实现了ObjectInput接口,ObjectOutputStream类实现了ObjectOutp...
继续访问
最新发布 【Java基础】自定义一个格式输出类
在项目实际开发中,后端接口都按照一定的格式输出给前端调用,在返回中包括状态码和接口的主要作用等注释,再包含实际的data。
继续访问

IO流(进阶提高)
本篇文章继上一篇IO流(小试牛刀)继续更新JavaIO流的知识。 常见IO流的结构图解: 回顾一下IO的基本接口知识: ————————————————————我是不起眼的分割线———————————————————————— IO的序列化与反序列化 Java序列化是指把Java对象转换为字节序列的过程;Java反序列化是指把字节序列恢复为Java对象的过...
继续访问
java进阶8——IO流
File类 File概述 File文件和目录路径名的抽象表示形式。即,Java中把文件或者目录(文件夹)都封装成File对象。也就是说如果我们要去操作硬盘上的文件,或者文件夹只要找到File这个类即可。 File类的构造函数 File(String pathname); // 将一个字符串路径封装成File对象 File(String parent,String child);...
继续访问
Java IO流进阶之常用流(一)
请多参考JDK文档:http://www.matools.com/api/java8或https://docs.oracle.com/javase/8/docs/api/ 转换流——OutputStreamWriter类和InputStreamReader类 字节与字符的转换流: OutputStreamWriter:是Writer类的子类,将输出的字符流变为字节流。 InputStreamRe...
继续访问
详解JAVA I/O之二——java.io层次结构
<br />java I/O(Input/Output)学习——java.io层次结构文章分类:Java编程stream代表的是任何有能力产出数据的数据源,或是任何有能力接收数据的接收源。在Java的IO中,所有的stream(包括Inputstream和Out stream)都包括两种类型: <br />(1)字节流 <br /><br /> 表示以字节为单位从stream中读取或往stream中写入信息,即io包中的inputstream类和outputstream类的派生类。通常用来读取二进制数据,

㈢ 有人用java写过文本分类系统吗

文本分类的重点不在分类,而在怎么样描述文本模型和提取文档中的terms并把它数字化,转化为分类器可以使用的输入类型。这前面的处理直接关系到后面分分类效果。就文本模型而言,现在普遍使用的还是Salton 和 McGill的Vector Space Model, 通过TF-IDF统计,如果是英文的话,要进行语义层次的抽象, 这方面可以使用WordNet,网上可以找到JAVA wordnet 的API,,个人认为比较好的是JWNL 如果是中文的话,涉及到分词, 中科院计算所分词系统ICTCLAS, 可到其网站上下载免费版。
至于JAVA写的分类器很多,常用的比如说Weka, RapidMiner(这个相当不错,有专门的Web data Mining的扩展包,是我的最爱),这些都可以自己调用其接口实现新的算法。个人强烈推荐使用RapidMiner,功能相当强大,几乎实现了当前的所有机器学习的算法,并且操纵简便。
学习提示:不要刚开始就希望效果很好,急躁是做学问的大敌,肯定会出现一些意想不到的问题,最主要是勤于思考,善于查找问题,慢慢改进,一个问题,如果比较难,回到它最原始最简单的问题上去。祝你学业进步。

㈣ java 流的分类有哪些

1. 处理的数据单位不同,可分为:字符流,字节流
字节流河字符流的区别:(各自在什么情况下使用)
字符流处理的单元为2个字节的Unicode字符,分别操作字符、字符数组或字符串,而字节流处理单元为1个字节, 操作字节和字节数组。所以字符流是由Java虚拟机将字节转化为2个字节的Unicode字符为单位的字符而成的,所以它对多国语言支持性比较好!如果是 音频文件、图片、歌曲,就用字节流好点,如果是关系到中文(文本)的,用字符流好点.
2.数据流方向不同,可分为:输入流,输出流
3.功能不同,可分为:节点流,处理流;
节点流:节点流从一个特定的数据源读写数据。
处理流:“连接”在已存在的流(节点流或处理流)之上通过对数据的处理为程序提供更为强大的读写功能。
看到左上角那个头像没,点一下这里有一群讨论问题的朋友;

㈤ java读取txt文件并且进行分类

public static void main(String[] args) throws Exception{
File file=new File("D:\\output.txt");
BufferedReader reader=new BufferedReader(new FileReader(file));

String r=null;

int one=0,two=0,three=0;
String [] temp=null;
while((r=reader.readLine())!=null)
{
if(r.contains("one"))
{
temp=r.split(":", r.length());
if(temp!=null)
{
if(!" ".equals(temp[1]))
{
one+=Integer.valueOf(temp[1]);
}
else{
one+=0;
}
}
}

else if(r.contains("two"))
{
temp=r.split(":", r.length());
if(temp!=null)
{
if(!" ".equals(temp[1]))
{
two+=Integer.valueOf(temp[1]);
}
else{
two+=0;
}
}
}
else if(r.contains("three"))
{
temp=r.split(":", r.length());
if(temp!=null)
{
if(!" ".equals(temp[1]))
{
three+=Integer.valueOf(temp[1]);
}
else{
three+=0;
}
}
}
}

System.out.println("One="+one+" ;Two="+two+" ;Three="+three);
}

自己测试一下:这是我的输出结果
Console:

One=190 ;Two=0 ;Three=410

㈥ 关于java新闻网站的算法

(一) 算法伦理的研究
1.算法内涵界定。算法源于数学,但现代算法又远远不止于传统数学的计算范畴。算法多被理解为是计算机用于解决问题的程序或步骤,是现代人工智能系统的运行支柱。《计算主义:一种新的世界观》(李建会等,2012)中将算法定义为能行的方法,在外界的常识性理解中所谓算法就是能感受到的一套运算规则,这个规则的特点在于运算时间的有限性、计算步骤的有穷性、输入结果的确切性,它是机械步骤或能行可算计程序。该定义点明了算法应具备的两个基本属性——有限性与有穷性。《用计算的观点看世界》( 郦全民,2016) 则从信息传播的角度解读算法,认为算法实质上是信息处理方法。
2.算法伦理研究
伦理关乎道德价值真理及其判断。存在于自然界、社会中的人,其行为应遵循一定的伦理道德规范。伦理的效应要导向善。伦理道德关注对个体存在的尊重、个体的自由、公平正义以及组织团体的延续与发展等问题。在一定程度上可以说,当今的人类社会已经不能脱离智能算法系统而运行了。
算法无时无处不在对世界产生影响,因而算法也会必然的触碰到伦理道德。和鸿鹏(2017)已指出,算法系统在人类社会生活中的广泛应用,会陷入诸多如人类面临且无法回避的伦理两难选择困境之中。而当算法与伦理发生关联时,学界一般认为会引出职业伦理和技术伦理两种伦理问题。
职业伦理主要与算法系统的开发者有关,指开发者是带有个性价值观、伦理道德观去研发算法系统的行为体,因而算法系统一开始便会掺杂着设计人主观性的伦理道德观。设计者出于何种目的开发某算法系统、面对不同问题设计者持有的伦理道德态度,这些都会在算法系统的运行中得到体现。
技术伦理是算法系统在一定意义上可称之为一种科学技术,这种技术自身及其运作结果都会负载着伦理价值。其实在一些情况下,职业伦理与技术伦理之间并没有很明确的界别,关于这一点,刘则渊跟王国豫已做过论述。
本文将主要从技术伦理的角度对算法关涉伦理这一问题尝试做深入研究。
(二)网络新闻传播的算法伦理研究
算法与技术的融合不断英语于网络新闻传播领域中,从数据新闻到机器写作,从算法推送到舆情到分析,国内新闻传媒领域的机器新闻和相关研究逐渐发展,金兼斌在《机器新闻写作:一场正在发生的革命》(2014),作者较早的将眼光聚焦于基于算法的新闻内容生产和编辑。认为在自动化新闻生产大发展的前提下,诸如新闻生产或分发中劳动密集型的基础性工作与环节都将被技术取代。张超、钟新在《从比特到人工智能:数字新闻生产的算法转向》(2017) 认为算法正在从比特形式走向人工智能阶段,这种转向使得数字新闻与传统新闻的边界进一步明晰,促使数字新闻生产也产生了变革。胡万鹏在《智能算法推荐的伦理风险及防范策略》中总结了从算法推送方面:针对新闻的价值观所受到的负面影响;以及新闻的公共性、客观性和真实性受到的削弱进行分析;从受众方面:将具体对信息茧房现象以及受众的知情权和被遗忘权展开探讨;从社会影响方面,则针对社会群体、社会公共领域和社会文化所受到的消极影响展开论述。
根据以上文献的梳理可以看出,国内目前对网络新闻传播的算法伦理研究主要集中在新闻业态算法伦理失范的相关问题,因为与其他失范问题相比,这是比较容易发现的。但目前关于网络新闻传播的算法伦理的国内研究还存在不足:国内算法伦理和网络新闻传播算法伦理的研究还是在起步阶段,比较成熟的系统性研究还未出现;关于算法开发人员和平台的责任机制的研究都比较薄弱,总上所述,算法推送新闻的伦理问题研究是有必要继续加强的。
2.新闻推荐算法的兴起、发展与原理
2.1 新闻推荐算法的兴起
随着计算机技术的信息处理的维度越来越高,信息处理的能力不断提升,算法技术可以从大数据中筛选出用户最关心最感兴趣的信息,改变了原有的新闻信息传播方式,重塑了新的媒介生态和传播格局。
但反过来看,在人人都能生产信息的背景下,信息的生产、传播和反馈的速度都是呈几何倍数增长,用户面对的信息越来越多。由于设备的局限性和信息海量,用户无法集中注意力看自己感兴趣的内容,也无法及时抓取对自己有用的信息,于是出现了“注意力经济”。美国经济学家迈克尔·戈德海伯(1997)认为,当今社会是一个信息极大丰富甚至泛滥的社会,而互联网的出现,加快了这一进程,信息非但不是稀缺资源,相反是过剩的。相对于过剩的信息,只有一种资源是稀缺的,那就是人们的注意力。换句话说,信息不能够一味追求量,还要有价值,价值就在于用户对信息的注意力,谁获得了用户的注意力就可以有市场的发展空间,通过“贩卖”用户的注意力能够使新媒体聚合平台获得利润,维持发展。再加上现在生活节奏越来越快,人们对信息获取的量和效率要求提高,不想把时间浪费在自己不感兴趣的信息,从而用户获取信息的“个性化”特征变得明显起来。
基于此背景下,算法推送新闻的传播机制应运而生,用户不需要特意搜索自己需要的信息,而是海量的信息会自行“找到”用户,为用户节省搜索时间之余,又能做到真正为用户提供有用的信息。
2.2新闻推荐算法的发展现状
算法推荐是依据用户数据为用户推荐特定领域的信息,根据受众使用反馈不断修正并完善推荐方案。目前主要有两类新闻机构使用算法推送,其一是新型的互联网新闻聚合类平台,国内主要是以今日头条和一点资讯等算法类平台为代表,在我国新闻客户端市场上拥有极高的占有率。张一鸣创建今日头条是依靠大数据和算法为用户推荐信息,提供连接人与信息的服务,算法会以关键词等元素判断用户的兴趣爱好,从全网抓取内容实现个性化推荐。国外则是以Facebook、Instagram等平台为代表,这些APP都是通过算法挖掘用户的数据,以用户个性化需求为导向对用户进行新闻推送。另一种则是专业新闻生产的传统媒体,为积极应对新闻市场的竞争和提高技术水平而转型到新闻全媒体平台,如国内的“人民日报”等,国外利用算法推送向用户推送新闻的传统媒体则有美国的美联社、华盛顿邮报和英国的BBC等,他们利用算法监督受众的数量还有阅读行为,使他们的新闻报道能够更加受受众的喜欢,增加用户的粘性。
2.2 新闻推荐算法的原理
2.2.1 新闻推荐算法的基本要素
算法推送有三个基本要素,分别是用户、内容和算法。用户是算法推送系统的服务对象,对用户的理解和认知越是透彻,内容分法的准确性和有效性就越准确。内容是算法推送系统的基本生产资料,对多种形式内通的分析、组织、储存和分发都需要科学的手段与方法。算法是算法推送技术上的支持,也是最核心的。系统中大量用户与海量的信息是无法自行匹配的,需要推送算法把用户和内容连接起来,在用户和内容之间发挥桥梁作用,高效把合适的内容推荐给合适的用户。
2.2.2 新闻推荐算法的基本原理
算法推送的出现需要具备两个条件:足够的信息源和精确的算法框架。其中,算法的内容生产源与信息分发最终效果密切相关:是否有足够多的信息可供抓取与信息是否有足够的品质令用户满意都将对信息的传播效果产生影响。与此同时,分发环节也在向前追溯,改变着整个传播的生态。目前,国内新闻传播领域所使用的算法推送主要有三大类——协同过滤推送、基于内容推送和关联规则推送。
协同过滤推送分为基于用户的协同过滤和基于模型的协同过滤。前者主要考虑的是用户和用户之间的相似度,只要找出相似用户喜欢的新闻文章类别,并预测目标用户对该文章的喜欢程度,就可以将其他文章推荐给用户;后者和前者是类似的,区别在此时转向找到文章和文章之间的相似度,只有找到了目标用户对某类文章的喜爱程度,那么我们就可以对相似度高的类似文章进行预测,将喜爱程度相当的相似文章推荐给用户。因此,前者利用用户历史数据在整个用户数据库中寻找相似的推送文章进行推荐,后者通过用户历史数据构造预测模型,再通过模型进行预测并推送。
基于内容的推送即根据用户历史进行文本信息特征抽取、过滤,生成模型,向用户推荐与历史项目内容相似的信息。它的优点之一就是解决了协同过滤中数据稀少时无法准确判断分发的问题。但如果长期只根据用户历史数据推荐信息,会造成过度个性化,容易形成“信息茧房”。
关联规则推送就是基于用户历史数据挖掘用户数据背后的关联,以分析用户的潜在需求,向用户推荐其可能感兴趣的信息。基于该算法的信息推荐流程主要分为两个步骤,第一步是根据当前用户阅读过的感兴趣的内容,通过规则推导出用户还没有阅读过的可能感兴趣的内容;第二是根据规则的重要程度,对内容排序并展现给用户。关联规则推送的效果依赖规则的数量和质量,但随着规则数量的增多,对系统的要求也会提高。
2.2.3 算法推送的实现流程
在信息过载的时代,同一个新闻选题有很多同质化的报道,因此分发前需要对新闻内容进行消重,消重后的新闻内容便等待推送,此时的推送有三个类别:启动推送、扩大推送和限制推送。
第一类是启动推送,先对用户精准推送,即将其订阅账号的更新内容第一时间向用户推荐;然后根据用户的历史浏览数据,把相似的文本特征归类后推送给其他用户;最后是给关注用户的相似人群进行推荐。第二类扩大推送是指对于某个点击率、阅读时长都明显高于平均水平的新闻内容,系统会将它自动筛选出来,并向更多的人进行推荐。但在扩大推荐的过程中,系统会依据用户的反馈进行调整。第三为限制推送,指某个点击率、阅读时长都明显低于平均水平的新闻内容,会被系统自动筛选出来,遏制推送,这样的内容会被缩小推荐范围。

3. “今日头条”新闻推荐算法分析
“今日头条”是国内一款资讯类的媒体聚合平台,每天有超过1.2亿人使用。从“你关心的,才是头条!”到如今的“信息创造价值!”,产品slogan的变化也意味着今日头条正逐渐摆脱以往单一、粗暴的流量思维,而开始注重人与信息的连接,在促进信息高效、精准传播的同时注重正确的价值引导。
在2018年初,“今日头条”的资深算法架构师曹欢欢博士在一场分享交流会上公开了其算法运行原理。在他的叙述中,非常详细地介绍了“今日头条”的算法推荐系统概述以及算法推荐系统的操作原理。

3.1.1-1 曹欢欢博士的今日头条算法建模
上图用数学形式化的方法去描述“今日头条”的算法推送,实际上就是一个能够得出用户对内容满意程度的函数:即y为用户对内容的满意度,Xi,Xc,Xu分别是今日头条公开的算法推送的三个维度:Xi是用户,包括用户的性别、年龄、职业和兴趣标签,还有其他算法模型刻画的隐形用户偏好等;Xc是环境,这也是移动互联网时代新闻推送的特点,由于用户随时随地在不停移动,移动终端也在移动,用户在不同的工作场合、旅行等场景信息推送偏好也会不同;Xu是内容,今日头条本身就是信息聚合类平台,平台上涵盖各种不同形式的内容。本章将以该函数为基础,逐一分析今日头条的推荐算法。
3.1 推荐维度之一:内容分析
内容分析原指第二次世界大战期间,传播学家拉斯韦尔等研究学家组织了“战士通讯研究”的工作,以德国公开出版的战时报纸为分析研究对象,弄清报纸内容本质性的事实和趋势,揭示隐含的隐性情报内容,获取了许多军情机密情报并且对事态发展作出情报预测。在“今日头条”中,内容分析则是对文章、视频内容提取关键要素,通过对文本、视频标题关键字进行语义识别,给内容进行分类。“今日头条”的推送系统是典型的层次化文本分类算法,来帮助每篇新闻找到合适的分类,比如:第一大分类是政治、科技、财经、娱乐、体育等,体育类可以下分篮球、足球、网球等,足球又可以下分中国足球和国际足球,中国足球最后下分为甲、中超、国家队等。这一步是对文章进行对这个工作主要目的是对文章进行分类,方便以后对客户推荐。
想要内容分析实现效果,则需要海量的内容信息给算法系统提供有效的筛选和分类。“今日头条”既然是依赖于算法推送新闻,那它背后的数据库必然是强大的,“网页蜘蛛”和“头条号”就是支撑今日头条平台消息来源的重要渠道,其消息来源极其丰富,何时何地有何新鲜事,都能高效率抓取信息。
第一个消息来源的渠道是“网页蜘蛛”,“网页蜘蛛”又叫网页爬虫,头条使用的就是搜索引擎爬虫叫“Bytespider”。它能按照一定的规则,自动爬行抓取互联网的信息或脚本,就像蜘蛛通过蛛网进行捕食,当发现新的信息资源,蜘蛛会立刻出动抓取信息内容并将其收入自己的数据库中。和微信的垂直搜索不同,Bytespider是能够抓取全网内容的全新搜索引擎,因此“今日头条”的搜索引擎功能很全面,搜索的资源很广,资源包容性极高。
Bytespider信息抓取的基本流程如下:首先是网页抓取。Bytespider顺着网页中的超链接,从这个网站爬到另一个网站,通过超链接分析连续访问抓取更多网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。第二步是处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括消除重复网页、判断网页类型、分析超链接、计算网页的重要度、丰富度等。第三步提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页,为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
第二个消息来源渠道是“头条号”。与“今日头条”不同,它是今日头条针对媒体、国家机构、企业以及自媒体推出的专业信息发布平台。致力于帮助生产者在移动互联网上高效率地获得更多的曝光和关注。简单来说头条号是媒体在上面撰写并发布文章、视频后,会在今日头条(包括今日头条极速版)平台展示。通过头条号后台,媒体可以看到具体文章推荐量、阅读量、粉丝阅读量、评论量、转发量和收藏量,最后通过这些可以量化的用户阅读行为的反馈,算法系统进一步对目标用户进行内容推荐。
3.2 推荐维度之二:用户分析
用户分析通过提取用户的有效数据,如用户经常浏览的文字类型、经常搜索的关键字、注册时登记信息的内容等,算法系统可以将每个用户的浏览记录、浏览时间、留言、评论和转发等行为进行关键字提取,最终形成用户画像,以便之后对用户进行文章和视频的精准推送。举个例子,给喜欢阅读“体育”的用户标上“体育”标签;给喜欢“娱乐”的用户标上“娱乐”的标签,这一步的作用是给用户的兴趣进行建模,包括用户对文章和视频的全局热度、分类热度,主题热度,以及关键词热度等。热度信息在大的推荐系统能够解决新闻冷启动问题,帮助新闻实现推送。
用户分析还具有协同特征,它可以在部分程度上帮助解决所谓算法越推越窄的问题。协同特征也就是“联想式”的推送方法,并非只考虑用户已有历史,而是通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力。根据用户之间计算数据的相似程度,把用户细化分类成为不同的目标群体,再向目标群体集中的推送其感兴趣的新闻内容
内容分析和用户分析是相辅相成的,如果没有分析的文本标签,无法得到用户兴趣标签,没有用户的兴趣标签就无法给用户定位实现精准推送。
3.3 推荐维度之三:环境分析
环境分析就是根据文章的时效性和接近性推送给相应的用户,比如获取用户当前所在位置是否在旅游区,这个可以通过获取用户的实时位置来实现。还会不断与用户之前经常出现的所在地进行对比等方式确认当前状态,分析出用户是在常住地区还是在旅行。这时若系统检测到用户正在泰山及周边游玩,则可能会相应推送泰山的相关文章、周边的交通新闻和天气信息等等。
通过上面三个推荐维度可以作为数据基础,分析当前用户处于什么环境,结合用户画像以及文章的内容分类来推荐,尽量做到推送的内容都是用户所感兴趣的。算法系统还会通过内容分类、分析抽取,把文本相似度高的文章,包括新闻主题、内容相似的文章进行消重,解决推送重复的问题,进一步对目标用户进行精确且不重复的内容推荐。最后过滤质量低俗色情的内容,以免造成平台会有负面倾向。
3.4 “今日头条”新闻推荐算法的价值取向
3.4.1 “用户为上”
“今日头条”的算法推送是站在用户的立场上的,以满足用户个性化和推送的精准性,“今日头条”也重新衡量了新闻价值标准:以用户为上,用户对新闻内容和阅读方式的满意度便是平台推送新闻的价值宗旨。传统媒体时代,只有报纸和电视,有什么受众就得看什么,而如今“今日头条”根据用户兴趣去进行推送。算法推送平台用户范围广,很多用户热衷关注负面,也有许多用户都有窥视欲和好奇心,喜欢无聊八卦和无聊新闻,而且在好奇心作用下用户都有从众心理。这使得生产者过度去迎合受众,只要是用户喜欢看就可以发表在“今日头条”上。
3.4.2 “算法主导”
“今日头条”更注重技术分发,生产者是用户,受众者也是用户,这样一来内容监管和分发就很困难。算法推送机制根据用户爱好进行推送,这样生产的内容快、也无疑会加速内容配送效率。在算法推送模型中,用户点击频率、阅读时间、点赞评论以及转发在算法时代都是可以进行量化的目标。在这样情况下生产的内容,想要获得较大点击率和推送率,需要标题才能吸引用户,因为用户在平台一眼能看到的就是标题和配图。标题和配图决定用户是否会打开你的内容,这导致许多内容生产者在编辑新闻标题时陷入标题党的怪圈,还有导致低俗内容的呈现,以制造冲突制造悬念贴标签等方式引用户点击,意图把自己的文章做成爆文。对于海量的信息内容,即使今日头条数据和智能推荐做的再好,目前来说也难以抵挡海量的垃圾信息。
4.算法推送新闻引发的伦理问题
在如今网络时代的传播思维中,“用户为上”、“算法主导”的新闻价值取向已经在算法聚合类平台成为了普遍,算法推送技术作为吸引用户的手段,搭建起一个充满诱导的媒介环境,以此增加用户对平台的粘性。算法推送技术在获取信息、传播速度等方面与以往相比有着跨时代的进步,但与此同时,由于算法推送技术的加入,衍生出新的伦理问题,并且日渐复杂化。
4.1 算法推送引发的伦理问题
4.1.1 算法推送过于机械化,没有思考能力
单向的算法推荐对用户来说经常会带来内容杂乱无章、信息量过大、信息价值低等问题。从逻辑讲,算法只是从关键字的检索匹配来完成统计推荐,但对新闻报道或文学作品具有艺术性、专业性的内容来说,是不能保证推送的质量的。算法方面,目前主要基于匹配检索与统计,大部分都是个人关注的信息类型和标签,难以达到较好的推送效果。一千个人眼里有一千个哈姆雷特,但是计算机只有只有一个。算法技术过于注重机械化的统计,只根据关键词来推荐用户,对我们中国具有博大精深的中国文字文化底蕴,推荐算法是远远不够的。整个新闻客户端显得像是一个菜市场,没有态度、没有风格,阅读感受单一化,呈现了碎片化的特点。新闻不只是让用户能够了解身边发生的新鲜事,还有宣传正面思想和传播正能量的作用,新闻应该还要给人们带来新的思考。让机器做出正确判断很简单,但是让机器综合心理学、社会学、乃至某细分领域内的规则做出判断还要正确地引导受众则很难,正如现在算法技术还不能完成一篇富有人文性、文学性和批判性的深度报道,它止步在了碎片式的、表层的传播范畴。
4.1.2 容易引起“信息茧房”效应
“信息茧房”这一概念是凯斯.桑斯坦在《信息乌托邦》一书中提出的。意指受众在过度的信息自我选择之中,这样会降低接触外界其他信息的可能,从而将自己的生活桎梏于蚕茧一般的“蚕房”中的现象。人们的信息领域会习惯性被自己的兴趣引导,信息窄化带来了受众对信息接收的单一性,这种单一性的可能会使受众陷入循环,加重受众信息同质化。
在互联网的普及初期,受众主要是从主流媒体和门户网站获取新闻信息,主流媒体能够保障新闻的质量;对于其他资讯的获取,由于技术的限制,此时的茧房并没有过度被放大,受众是有适当的自主选择性阅读新闻的。但到了如今以智能技术的互联网时代,情况发生了改变,信息茧房的现象越来越明显,用户被标签的情况下,算法系统进行大量的主动推送,使受众被动地成为信息的接收者。用户的阅读兴趣不可能涵盖所有的知识领域,算法分发的核心逻辑是根据用户的行为数据来进行精确推荐的,但同时算法又会自动过滤掉“不感兴趣”“不认同”的信息,实现“看我想看,听我想听”。在此过程中,因为算法技术的力量将用户的信息选择效果放大了倍数,进而将受众困住在信息茧房当中,受众也很难凭借自身力量打破茧房,甚至在不知觉中受到更多负面的影响。

4.1.3 算法推送的“伪中立性”
客观和全面是新闻伦理的基本要求,新闻从业者必须从可好信息源来获取真实的信息,以客观的态度反应现实。我们惯常认为,互联网技术服务商是技术中立者,不需要承担约束大众媒体的社会责任,然而当信息把关人又新闻编辑转变为算法工程师,传统的媒介伦理似乎已经失效。算法具有商业倾向性,“中立性”是算法平台用以逃避媒体责任的理由,给大众媒介造成传播乱象,如此一来更像是一场算法平台“肆意妄为又不想负责”的诡辩。
算法平台的信息源是经过选择和过滤的,“头条号”的内容占“今日头条”整个信息系统的绝大部分,然而在“人人都可以做新闻人”的时代,头条号平台是一个开放的网络媒介环境,存在大量的偏见和错误的认知。无论是“今日头条”平台设立的算法规则,还是其他爬虫的抓取的关键词,算法系统的信息源很多是具有目的性的、有偏见和非客观的信息,所以信息源不能直接作用于用户。因此,筛选算法系统的信息源与传统的人工编辑相比较,范围极广且很难把关,若算法被恶意利用,那么使整个传播系统将会被轻易控制。
4.1.4 算法推送里的“议程设置”
原议程设置功能揭示的重要内涵是:“受众对新闻的看法虽然被大众媒体议程设置功能所主导,但其更深刻的是议程设置给大众媒体新闻带来放大与延伸,从而使受众对新闻选择做出能动性修正,让受众在满足需求和媒介依赖中逐渐培养出的潜在认同感”。
推送算法技术在互联网平台的运用,使原来传统媒体主导的议程设置过程发生了变化,伴随着传播权的转移、公众参与度的提高和信息量剧增等原因导致议程设置功逐渐能减弱。过往传统新闻的内容是由编辑有选择地进行报道后再呈现在受众面前的,而个性化新闻推送是用户自己来选择看哪一方面的内容,而这一环节中,天然的技术赋权将传播权从传统媒体下放至平台的用户,使得受众和社会的连接无需依赖传统媒介,新闻媒体作为把关人的作用和议程设置功能都在减弱。
4.2 算法新闻治理缺陷下的算法权利异化
算法作为人工智能的基石之一,是“一种有限、确定、有效并适合用计算机程序来实现的解决问题的方法,是计算机科学的基础”。近年来,伴随人工智能深度学习算法取得的重大突破和大数据时代的到来,人工智能的应用场景不断拓展,人工智能时代正逐渐从想象成为现实。借助于海量的大数据和具备强大计算能力的硬件设备,拥有深度学习算法的人工智能机器可以通过自主学习和强化训练来不断提升自身的能力,解决很多人类难以有效应对的治理难题。伴随人工能算法在国家和社会治理中重要性的日渐凸显,国家和社会对于算法的依赖也逐渐加深,一种新型的权力形态——算法权力也随之出现。
可以把算法权利分为四种:数据主权、算法设计权、研发的资本权和算法控制权。由于前三种权利都是单向的、算法开发者赋予算法的权利,是属于算法开发者的,与算法分发平台呈现的效果没有直接的影响,所以本文将着重论述算法控制权。
算法控制权是双向的,用户是算法技术数据行为的提供者,同时又是被算法技术控制的受害者。例如我们看到“今日头条”会通过推送算法来监管用户的发布和浏览行为,同时平台会通过算法决策系统来实现内容的发布去引导用户。算法控制权当然是一种天然技术赋予的权利,但算法控制权是在用户提供数据行为的情况下才得以实现的,因此算法控制权既存在内容生产权,同时有要尊重和保护算法相对人的义务。
正因为如此,算法技术被认为是一种双刃剑,一方面算法能够做出精准的行为预测,可以为管理者提供非常好的循环干预机制;对于公共行为主体来说,可以通过对大数据的应用来解决社会治理问题,对于私人主体来说可以借助数据来提供个性化和定制化的服务;另一方面,算法技术存在着诸如利益和风险不对称等问题,而且由于算法技术发展的超前性,新科技的创造者具备不对称的信息和技术优势,能够按照自身利益的需求来塑造在平台上的算法推送逻辑和社会系统,这带来了监管的不确定性。人们要通过集体行为去承担社会责任,通过这样的方式规制算法权利,可以让我们能够对算法分发系统的意义和价值得到更深刻的思考。

热点内容
系统启动密码怎么取消 发布:2025-07-03 04:08:06 浏览:744
python程序设计第三版课后答案 发布:2025-07-03 03:58:08 浏览:213
socket上传文件 发布:2025-07-03 03:57:24 浏览:895
安卓cleo脚本 发布:2025-07-03 03:41:26 浏览:245
编程器解读 发布:2025-07-03 03:22:49 浏览:24
中国电信加密通信业务 发布:2025-07-03 03:06:00 浏览:521
脚本家的台词 发布:2025-07-03 03:05:50 浏览:709
arcgisforpython 发布:2025-07-03 03:05:46 浏览:899
期计算法 发布:2025-07-03 02:56:53 浏览:405
不同域访问 发布:2025-07-03 02:49:05 浏览:819